如何在COVID-19疫情期间推动IT战略

发布时间：2021-02-20 18:18:32 所属栏目：评论来源：互联网

导读：epoll，已经大大优化了IO的执行效率，但在IO执行的第一阶段：数据准备阶段都还是被阻塞的。所以这是一个可以继续优化的点。 6. IO 模型之信号驱动IO(SIGIO) 信号驱动IO与BIO和NIO最大的区别就在于，在IO执行的数据准备阶段，不会阻塞用户进程。如下图所示：

epoll，已经大大优化了IO的执行效率，但在IO执行的第一阶段：数据准备阶段都还是被阻塞的。所以这是一个可以继续优化的点。

6. IO 模型之信号驱动IO(SIGIO)

信号驱动IO与BIO和NIO最大的区别就在于，在IO执行的数据准备阶段，不会阻塞用户进程。如下图所示：当用户进程需要等待数据的时候，会向内核发送一个信号，告诉内核我要什么数据，然后用户进程就继续做别的事情去了，而当内核中的数据准备好之后，内核立马发给用户进程一个信号，说”数据准备好了，快来查收“，用户进程收到信号之后，立马调用recvfrom，去查收数据。

但是，select有一个限制，就是存在连接数限制，针对于此，又提出了poll。其与select相比，主要是解决了连接限制。

select/epoll 虽然解决了NIO重复无效系统调用用的问题，但同时又引入了新的问题。问题是：

用户空间和内核空间之间，大量的数据拷贝

内核循环遍历IO状态，浪费CPU时间

换句话说，select/poll虽然减少了用户进程的发起的系统调用，但内核的工作量只增不减。在高并发的情况下，内核的性能问题依旧。所以select/poll的问题本质是：内核存在无效的循环遍历。

5.2. IO多路复用之epoll

针对select/pool引入的问题，我们把解决问题的思路转回到内核上，如何减少内核重复无效的循环遍历呢?变主动为被动，基于事件驱动来实现。其流程图如下所示：

数据标注中包含的一系列任务：

丰富数据的工具
质量保证
流程迭代
管理数据标签
培训新的数据标签
项目计划
成功指标
流程运作

AI专业人员的数据标签挑战?

在典型的AI项目中，专业人员在进行数据标注时会遇到以下几个方面的挑战。

数据标签质量低下。数据标签质量低可能有很多原因。其中最突出的原因之一是任何企业或工作流程确实三个决定因素：人员，流程和技术。
无法扩展数据标注操作。当数据量不断增长并且业务或项目需要扩展其容量时，由于大多数企业都在内部标记数据，因此它们通常也难以扩展其数据标注任务。
难以承受的成本和不存在的结果。企业和AI项目经理通常雇用高薪数据科学家和AI专业人士或一组业余人员来处理数据标签，而企业需要承担高昂的人工成本，当然企业也会面临数据标签不确定所带来的问题，所以合适的专业人员至关重要。
质量保证。进行质量检查可以为数据标注过程提供重要价值，尤其是在机器学习模型测试和验证的迭代阶段。

谁来标注数据?

相关调查显示，2019年，企业在数据标签上的支出超过17亿美元。到2024年，这一数字将达到41亿美元。进行数据标注工作，除了雇佣专业的数据科学家和AI专家之外，还可以考虑通过其他方式。

雇员。这包括雇用包括AI专业人员在内的全职或兼职员工，参与AI项目的各个方面，其中之一是数据标注。

托管团队。他们是经验丰富，且训练有素的数据标签团队。

承包商。他们包括自由职业者和临时工。

众包。企业可以使用第三方平台一次性寻找数据标注团队。

（编辑：宜春站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

蓄势待发！小米12三机	moto edge X30上线全
我处于硅谷管芯片	鸿蒙OS明年冲击欧洲市