加入收藏 | 设为首页 | 会员中心 | 我要投稿 海南站长网 (https://www.0898zz.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 动态 > 正文

如何在你的创业公司中运用大量的 AI 模型

发布时间:2022-10-30 12:01:49 所属栏目:动态 来源:网络
导读:   随着机器学习技术的成熟,并从一开始的好奇研究转向工业化的使用,支持大规模机器学习所需的方法和基础设施也在不断发展。利用这些进展对初创公司来说既是机遇也是风险,几乎所有的初创
  随着机器学习技术的成熟,并从一开始的好奇研究转向工业化的使用,支持大规模机器学习所需的方法和基础设施也在不断发展。利用这些进展对初创公司来说既是机遇也是风险,几乎所有的初创公司都在以这样或那样的方式利用机器学习,以争夺市场份额。
 
  这一过程始于 9 年多以前,2012 年,一份名为 AlexNet 的文件向年度 ImageNet LSVRC 竞赛(由研究界举办的计算机视觉竞赛)提交了参赛作品,启动了深度学习革命。在这篇论文中,一个三人小组(Alex Krizhevsky, Illya Sutskever 和 Geoffrey Hinton)使用了一种被称为卷积神经网络(convolutional neural network)的技术来理解照片的内容。他们轻松地赢得了比赛,以巨大的优势击败了其他所有人,而且是用一个用于玩视频游戏的 700 美元的电脑显卡训练出来的系统。
 
  机器学习的世界被永远地改变了。一年之内,复制 AlexNet 的创业公司如雨后春笋般涌现。我之前的公司 AlchemyAPI(2015 年被 IBM 收购),早在 2013 年就通过我们的 AlchemyVision 计算机视觉 API 发布了这项工作的首批商业版本。这一时期成立的其他创业公司包括 DeepMind(被谷歌收购)、MetaMind(被Salesforce收购)和 Clarifai 等。学术界也发生了巨大的转变,许多专家从对人工智能的怀疑,迅速转变为全身心地拥抱深度学习。
 
  1. “预训练”的网络可以帮助初创公司成长
  像 AlexNet 这样的神经网络最初是为每项任务从零开始训练的,当网络需要在单个游戏硬件上花费数周的时间时,这是可行的,但当网络规模、计算资源和训练数据量开始以数量级增长时,难度就大得多了。这导致了一种被称为“预训练”(pre-training)的方法的普及,即神经网络首先在使用大量计算资源的大型通用数据集上进行训练,然后使用少量的数据和计算资源对手头的任务进行微调。

  2. 基础模型的风险:规模、成本和外包创新
  然而,在预先训练的基础模型领域,并不是一切都是美好的,随着其被越来越频繁地使用,也存在一些风险。

  然而,即使这些最新的模型是开源的,简单地加载这些网络来进行预测也需要消耗更多的资源,很多初创公司和学术研究人员都无法轻易获取。例如,OpenAI 的 GPT-3 仅仅是加载就需要大量的 GPU。即使使用 Amazon Web Services 等现代计算云,这也需要将数十台 Amazon 最昂贵的 GPU 机器配置到一个高性能计算集群中。

(编辑:海南站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!