加入收藏 | 设为首页 | 会员中心 | 我要投稿 宜春站长网 (https://www.0795zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 评论 > 正文

如何在COVID-19疫情期间推动IT战略

发布时间:2021-02-20 18:18:32 所属栏目:评论 来源:互联网
导读:epoll,已经大大优化了IO的执行效率,但在IO执行的第一阶段:数据准备阶段都还是被阻塞的。所以这是一个可以继续优化的点。 6. IO 模型之信号驱动IO(SIGIO) 信号驱动IO与BIO和NIO最大的区别就在于,在IO执行的数据准备阶段,不会阻塞用户进程。如下图所示:

epoll,已经大大优化了IO的执行效率,但在IO执行的第一阶段:数据准备阶段都还是被阻塞的。所以这是一个可以继续优化的点。

6. IO 模型之信号驱动IO(SIGIO)

信号驱动IO与BIO和NIO最大的区别就在于,在IO执行的数据准备阶段,不会阻塞用户进程。如下图所示:当用户进程需要等待数据的时候,会向内核发送一个信号,告诉内核我要什么数据,然后用户进程就继续做别的事情去了,而当内核中的数据准备好之后,内核立马发给用户进程一个信号,说”数据准备好了,快来查收“,用户进程收到信号之后,立马调用recvfrom,去查收数据。

 

但是,select有一个限制,就是存在连接数限制,针对于此,又提出了poll。其与select相比,主要是解决了连接限制。

select/epoll 虽然解决了NIO重复无效系统调用用的问题,但同时又引入了新的问题。问题是:

用户空间和内核空间之间,大量的数据拷贝

内核循环遍历IO状态,浪费CPU时间

换句话说,select/poll虽然减少了用户进程的发起的系统调用,但内核的工作量只增不减。在高并发的情况下,内核的性能问题依旧。所以select/poll的问题本质是:内核存在无效的循环遍历。

5.2. IO多路复用之epoll

针对select/pool引入的问题,我们把解决问题的思路转回到内核上,如何减少内核重复无效的循环遍历呢?变主动为被动,基于事件驱动来实现。其流程图如下所示:


 

数据标注中包含的一系列任务:

  • 丰富数据的工具
  • 质量保证
  • 流程迭代
  • 管理数据标签
  • 培训新的数据标签
  • 项目计划
  • 成功指标
  • 流程运作

AI专业人员的数据标签挑战?

在典型的AI项目中,专业人员在进行数据标注时会遇到以下几个方面的挑战。

  • 数据标签质量低下。数据标签质量低可能有很多原因。其中最突出的原因之一是任何企业或工作流程确实三个决定因素:人员,流程和技术。
  • 无法扩展数据标注操作。当数据量不断增长并且业务或项目需要扩展其容量时,由于大多数企业都在内部标记数据,因此它们通常也难以扩展其数据标注任务。
  • 难以承受的成本和不存在的结果。企业和AI项目经理通常雇用高薪数据科学家和AI专业人士或一组业余人员来处理数据标签,而企业需要承担高昂的人工成本,当然企业也会面临数据标签不确定所带来的问题,所以合适的专业人员至关重要。
  • 质量保证。进行质量检查可以为数据标注过程提供重要价值,尤其是在机器学习模型测试和验证的迭代阶段。

谁来标注数据?

相关调查显示,2019年,企业在数据标签上的支出超过17亿美元。到2024年,这一数字将达到41亿美元。进行数据标注工作,除了雇佣专业的数据科学家和AI专家之外,还可以考虑通过其他方式。

雇员。这包括雇用包括AI专业人员在内的全职或兼职员工,参与AI项目的各个方面,其中之一是数据标注。

托管团队。他们是经验丰富,且训练有素的数据标签团队。

承包商。他们包括自由职业者和临时工。

众包。企业可以使用第三方平台一次性寻找数据标注团队。



(编辑:宜春站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读