小企业小额融资的来龙去脉 8迹象表明您的企业不需要筹集资金 9种让客户满意的方法 (信息图) 约翰·奥利弗: 多层次营销不是一条很好的创业之路 使用知名商业加速器的注意事项 您的医疗索赔计费服务的3种收费方式 这个10岁的孩子在电视的 “鲨鱼坦克” 上游泳 作为创始人,我有4件事会有所不同 创业的时候有问题就可以了 设计和装备餐厅时要考虑的要点 通过免费的 “从员工到在线企业家” 副本,向财务自由迈进了一步 “捉鬼敢死队” 可以教给您有关开办小型企业的13件事 如何评估您的初创公司-不会出错 创造性破坏: 快速移动并打破事物 7迹象表明,是时候从员工过渡到企业家了 创建赚钱博客的快速指南 创业公司吸引风投的4种方式 5谎言世界告诉企业家如何成功 Bootstrapers的优势: 稀缺性提升创造力 向朋友和家人借钱的硬道理和技巧 如何成为自己的老板并在工作中喝酒 企业家的奥秘: 关于创业的5个常见误区 两名妇女开办学校教人们如何成人 如何在9比5的工作中启动您的创业公司 4种方法来决定你是否应该追求你的创业理念 引导最聪明的方式 在与投资者建立联系之前,您必须做的10件事 热情的企业家即使在袜子行业也能找到成功 2021年中小企业数字化赋能系列活动数字赋能融合发展论坛成功召开 6辞职成为企业家的强大好处 研究: 企业选择自由职业者来逃避医疗费用 您是否有能力使您的承包业务取得成功? 停止抱怨,开始胡搞 在前100天获得动力。否则。 你有专业知识让你的承包业务取得成功吗? 鲨鱼坦克的戴蒙德·约翰 (Daymond John) 说,您必须做的3件事可以帮助您的初创公司生存 两小时销售1817万!江西“百县百日”文旅消费季 直播带货大赛正式拉开帷幕 您的公司在启动时可以做的4件事 在您的业务启动前几个月建立炒作的7种方法 你讨厌的朝九晚五的工作并不像你想象的那么安全 购物特许经营时首先要寻找什么 这家公司如何在赚钱的同时有所作为 建立6位数咨询的5个步骤 教练是完美的个人业务的8个原因 党日活动--观看抗美援朝电影《长津湖》 在线课程可能没有您希望的那么有价值 为什么逆戟鲸岛出租车从一个小岛上获得大笔生意 美国各地的社区都在利用企业家精神来推动增长 这是一项6位数的服务业务,您可以以低于100美元的价格开始 企业家应该总是涉足副业。这就是原因。
您的位置:首页 >社会 >

将数据用于人工智能时要记住的5件事

2021-10-01 10:11:11 来源:

数据是新兴的数据驱动和人工智能经济中公司最重要的战略资产之一。需要数据来衡量业务策略的效率并从其运营中汲取见解,还需要训练机器学习算法。获取数据对公司来说不是问题,问题是他们能否获得正确的数据,并能否为他们提供非常理想的竞争优势。

许多公司没有意识到他们坐在一堆糟糕或肮脏的数据上。这些数据包含大量缺失的字段,格式错误,重复大量,或者仅仅是不相关的信息。IBM research估计,美国经济每年不良数据的成本高达3.6万亿美元。尽管如此,许多经理仍然可以肯定,他们坐在数据的金矿上,而实际上他们没有任何价值。

我采访了sergey Zelvenskiy,他是ServiceChannel的一位经验丰富的机器学习工程师,在那里他使用人工智能自动化设施管理流程。当涉及到好的/坏的数据二分法时,我们谈到了常见的误解,以及公司在构建人工智能产品时应该关注什么。

正如Zelvenskiy所说,“公司拥有的数据不一定是坏的,只是解决问题很可能是不完整的。这里有一个鸡和蛋的问题。最初的系统通常是为了收集人为驱动的解决方案所需的数据而构建的,将其转移到人工智能驱动的解决方案可能需要填补空白。虽然人类可以快速评估这些并解决问题,但自动化系统需要自动化的方式来处理数据。"

关注产品。

找到好的数据应该从产品本身开始。为了获得好的数据,公司应该设计出能够为用户贡献数据提供正确激励的产品。良好的可用性和用户体验将鼓励用户贡献有价值的信息。

您可以始终争取用户在环模型,在该模型中,用户必须放弃他们的数据才能使用您产品的功能。这正是Google和Facebook获取大量数据以换取其服务的方式。用户甚至没有意识到他们绝对免费提供数据来支持高级机器学习算法并不断改进软件。

构建出色产品的最佳方法是在收集急需的数据的同时提供迭代改进。正如Zelvenskiy所说: “您可以通过Amazon Alexa的发展看到这一点。它背后的团队意识到了一般语音识别和识别一组简单的预定义命令的能力之间的区别。虽然许多其他公司都在努力采用通用语音识别和维持对话的能力,但Alexa团队专注于一套简单的命令和简单的脚本对话。"

Alexa团队通过以低价运送非常简单的解决方案来做到这一点,并征服了市场。专注于具体的简单用例并完善它赢得了最终的游戏。

针对正确的数据类型。

让我们以想要制造机器人的公司为例,该机器人将自动将图书馆的书籍上架。它有大量关于实际图书内容的数据,它知道作者的名字和这本书出版的年份。但是,实际上,这些数据不足以自动安排书籍。

Therobot只能使用现有数据来找到适合该书的书架。但是,它不知道这本书的尺寸,所以如果这本书能放在书架上,机器人很难说出这本书的尺寸。

该公司从未想过要收集这些信息,因为如果书适合该空间,图书馆工作人员可以轻松地将其删除。现在,该公司需要一个全新的数据集,而它没有。这意味着该公司必须为机器人配备某种评估书本测量值的方法。虽然这不是不可能的,但项目预算和时间表将会改变。

这就是为什么你应该总是问自己,你是否有正确的数据类型,有助于解决问题。

了解局限性。

通常,公司认为所有机器学习工程师都有相同的魔杖,可以解决所有与数据相关的挑战。这与事实相去甚远。回到图书馆的例子,自动评估物理对象的大小和重量的能力将需要一套非常不同的技能和能力。可以训练机器人找到合适的架子的人或系统不同于能够建立测量和称重书籍能力的人或系统。

这种资源计划应该在项目开始时开始,而不是在机器人被摧毁在不适合书架的书堆下时开始。

利用现有的专业知识。

只有在工程师和主题专家团队的辛勤工作完成后,人工智能才能做得更好。智能解决方案的开发需要专家的输入来理解和帮助解释现有数据,并找出它们用来解决问题的原理。

即使是DeepMind的AlphaGo Zero的最新突破,也不是我们完全不需要人类专家的绝对展示。围棋比赛规则定义明确,不能被对手打破。即使机器没有经过人类专家的培训,游戏规则也已编程到代码中,因此它可以与自己对抗以建立技能。构建该软件的工程师在对其进行编程之前就成为了游戏规则的专家。

根据Zelvenskiy的说法,“在AlphaGo Zero的情况下,我们没有专门的专家,因为比赛场地定义得很好,一个人可以在一个晚上学习完整的规则。在现实生活中,工程师几乎无法度过一个晚上,成为供应链,隐私法或涡轮机工程方面的专家。一般来说,人工智能项目要么需要一组定义明确的牢不可破的规则,要么需要一个带标签的数据集。通常,每个都有一点,弄清楚如何组合这个拼图的各个部分仍然需要专家的投入。"

Zelvenskiy补充说: “不要误会我的意思,当一个工程师团队通过获得正确的数据集并学习足够的游戏规则来成功解决难题时,就有成功的故事。然而,我们在这里依赖于生存偏见。"

管理数据并关闭循环。

有一天,您的应用程序可能会开始生成大量数据,因为它变得越来越受欢迎。为了避免陷入数据混乱,您应该从一开始就引入高效的数据仓库策略。无论您的公司选择什么数据平台,您都应该在数据采集过程的每个阶段都建立有效的数据收集,清理和数据争夺过程。

一旦您拥有了良好的产品,不断的数据流入和高效的数据管理基础架构,就可以更轻松地创建良好数据的自我实现的预言。

利用产品用户提供的数据可以改善AI平台和应用程序功能,并鼓励客户贡献更多的优质数据。这将创建一个自我维持的数据生成系统,使您的公司成为真正的数据驱动型企业。

免责声明:本网站所有信息仅供参考,不做交易和服务的根据,如自行使用本网资料发生偏差,本站概不负责,亦不负任何法律责任。如有侵权行为,请第一时间联系我们修改或删除,多谢。

今日中国财经