如何在你的创业公司中运用大量的 AI 模型

发布时间：2022-10-30 12:01:49 所属栏目：动态来源：网络

导读： 　　随着机器学习技术的成熟，并从一开始的好奇研究转向工业化的使用，支持大规模机器学习所需的方法和基础设施也在不断发展。利用这些进展对初创公司来说既是机遇也是风险，几乎所有的初创

　　随着机器学习技术的成熟，并从一开始的好奇研究转向工业化的使用，支持大规模机器学习所需的方法和基础设施也在不断发展。利用这些进展对初创公司来说既是机遇也是风险，几乎所有的初创公司都在以这样或那样的方式利用机器学习，以争夺市场份额。

　　这一过程始于 9 年多以前，2012 年，一份名为 AlexNet 的文件向年度 ImageNet LSVRC 竞赛（由研究界举办的计算机视觉竞赛）提交了参赛作品，启动了深度学习革命。在这篇论文中，一个三人小组（Alex Krizhevsky, Illya Sutskever 和 Geoffrey Hinton）使用了一种被称为卷积神经网络（convolutional neural network）的技术来理解照片的内容。他们轻松地赢得了比赛，以巨大的优势击败了其他所有人，而且是用一个用于玩视频游戏的 700 美元的电脑显卡训练出来的系统。

　　机器学习的世界被永远地改变了。一年之内，复制 AlexNet 的创业公司如雨后春笋般涌现。我之前的公司 AlchemyAPI（2015 年被 IBM 收购），早在 2013 年就通过我们的 AlchemyVision 计算机视觉 API 发布了这项工作的首批商业版本。这一时期成立的其他创业公司包括 DeepMind（被谷歌收购）、MetaMind（被Salesforce收购）和 Clarifai 等。学术界也发生了巨大的转变，许多专家从对人工智能的怀疑，迅速转变为全身心地拥抱深度学习。

　　1. “预训练”的网络可以帮助初创公司成长
　　像 AlexNet 这样的神经网络最初是为每项任务从零开始训练的，当网络需要在单个游戏硬件上花费数周的时间时，这是可行的，但当网络规模、计算资源和训练数据量开始以数量级增长时，难度就大得多了。这导致了一种被称为“预训练”（pre-training）的方法的普及，即神经网络首先在使用大量计算资源的大型通用数据集上进行训练，然后使用少量的数据和计算资源对手头的任务进行微调。

　　2. 基础模型的风险：规模、成本和外包创新
　　然而，在预先训练的基础模型领域，并不是一切都是美好的，随着其被越来越频繁地使用，也存在一些风险。

　　然而，即使这些最新的模型是开源的，简单地加载这些网络来进行预测也需要消耗更多的资源，很多初创公司和学术研究人员都无法轻易获取。例如，OpenAI 的 GPT-3 仅仅是加载就需要大量的 GPU。即使使用 Amazon Web Services 等现代计算云，这也需要将数十台 Amazon 最昂贵的 GPU 机器配置到一个高性能计算集群中。

（编辑：海南站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

.com域名又一次涨价	恒大汽车要来了！网传
高德地图上线自定义行	谷歌以为用户不缺流量