硬核科普|深度学习主流开发框架解读和比较(中篇)
专题推荐:金博士AI技术干货分享
文章推荐:硬核科普|深度学习主流开发框架解读和比较
(资料图片)
本文的知识点
通过本文,读者可以从中学习和掌握的关键知识点,包括:
1. 深度学习框架:了解不同的深度学习框架,如PyTorch、TensorFlow和Keras,并理解每个框架的特定优势和使用场景。
2. 每个框架的技术细节:了解每个框架的技术规格,如所用的编程语言、操作的API级别,以及架构类型
3. 性能比较:理解这些框架在性能上的差异,如速度和处理大数据集的能力,例如Keras适合较小的数据集,而PyTorch和TensorFlow适合处理大数据集并提供高性能。
4. 如何选择合适自己或行业的框架:学习在选择深度学习框架时应考虑的因素,如数据集的大小和类型、可用性的模型集,社区支持以及部署相关的流程和工具等。
大应用对开发框架的要求
PyTorch 和 TensorFlow 都有其独特的开发历程和复杂的设计决策历史。之前,这使得比较两者变得是一个关于它们当前特点和未来特点的复杂技术讨论。鉴于两个框架自从创立以来都已迅速成熟,许多这些技术差异现在已经不再重要。
幸运的是,对于那些不希望听得昏昏欲睡的人来说,当前的 PyTorch 与 TensorFlow 的争论主要围绕三方面实践所需考虑的因素:
1. 模型可用性:随着深度学习领域的逐年扩大和模型相应地变得更大,从零开始训练最先进的模型已经不再可行。幸运的是,现在有许多最先进的模型公开可用,使用它们在可能的地方很重要。
2. 部署基础设施:如果训练出的性能良好的模型不能被利用,那训练它们就没有意义。降低部署时间至关重要,尤其是随着微服务业务模型越来越受欢迎;高效的部署有可能决定许多以机器学习为中心的业务的成败。
3. 生态系统:深度学习不再只是在高度控制的环境中的特定用例。AI正在为众多行业注入新的能量,因此,一个位于更大生态系统中的框架,可以为移动设备、本地和服务器应用程序提供开发支持变得很重要。此外,专用机器学习硬件的出现,如 Google 的 Edge TPU,意味着成功的实践者需要使用能够与这种硬件很好地集成的框架。
我们将依次探讨这三个实际考虑因素,然后提供我们对在不同领域使用哪个框架的建议。
模型可用性比较
从零开始实现一个成功的深度学习模型可能是一项非常棘手的任务,特别是对于如 NLP 这样的应用,其中工程和优化都很困难。SOTA(State-of-the-Art,最新的、最先进的)模型日益复杂,这对于小规模企业来,模型训练和微调都不太实际,甚至近乎不可能。初创公司和研究人员都没有计算资源来自己利用和探索这样的模型,因此,能够使用预训练模型进行迁移学习、微调或开箱即用的推理就显得非常宝贵了。
在模型可用性方面,PyTorch 和 TensorFlow 有着明显的差异。PyTorch 和 TensorFlow 都有自己的官方模型仓库,我们将在下面的生态系统部分探讨,但实践者可能希望使用其他来源的模型。
我们下面从三个维度来比较模型可用性:1)在 HuggingFace 上公开的模型所支持的框架类型数量, 2)出版的科研论文其研究所基于的框架类型, 3)基于网站 Paper-with-Code,对提供代码的论文所采用的框架类型进行统计分析。
HuggingFace
HuggingFace 是一家领先的人工智能公司,致力于开发和提供一流的自然语言处理(NLP)技术。它是名为Transformers库的开发者,该库是一个开源项目,提供了各种最新的深度学习模型,如BERT、GPT-2、GPT-3和T5等,供研究人员和开发者使用。这些模型广泛应用于文本分类、信息抽取、语义理解、自然语言生成等任务。
HuggingFace的Transformers库是NLP领域的一个重要资源,提供了丰富的预训练模型和相关工具,帮助开发者和研究人员简化开发过程,快速实现各类NLP任务。此外,Transformers库也是一个活跃的社区,研究者和开发者可以在其中相互学习,分享知识和经验。
除了Transformers库,HuggingFace还提供了一个在线模型库,用户可以在其中找到、分享和使用各种预训练模型。此外,HuggingFace还开发了一些其他工具,如Datasets库,这是一个开源的数据集库,用于处理和加载各种NLP数据集。总的来说,HuggingFace是推动当前NLP领域发展的重要力量,为研究和应用提供了极大的便利。
HuggingFace可以让你只用几行代码就将训练有素、调整优化过的 SOTA 模型纳入你的开发流程中。
当我们比较 HuggingFace 对 PyTorch 和 TensorFlow 模型的可用性时,结果有点令人惊讶。下面我们看到的是在 HuggingFace 上可用的模型总数的图表,这些模型要么仅限于 PyTorch 或 TensorFlow,要么适用于两种框架。可以看到,只能在 PyTorch 中使用的模型数量绝对压倒了竞争对手。几乎有92% 的模型仅支持 PyTorch,比2022 年的 85% 还要多。相反,只有大约 8% 的模型仅支持 TensorFlow,所有可用模型中只有大约 14% 支持 TensorFlow ,比2022年的 16%还要少。此外,2022 年新增了超过4.5 万个仅支持 PyTorch 的模型,而只增加了约 4 千个仅支持 TensorFlow 的模型。
图 1 HuggingFace 上的模型数量
如果我们把注意力集中在 HuggingFace 最受欢迎的 30 个模型上,我们会看到有趣的结果。所有模型都可在 PyTorch 中使用,和去年一样,没有任何模型只支持 TensorFlow。不过同时支持两种框架的模型数量已经从 19 增加到 23。
图 2 HuggingFace 上排名前 30 的模型
研究论文
关键词:
相关阅读
-
硬核科普|深度学习主流开发框架解读和比...
专题推荐:金博士AI技术干货分享文章推荐:硬核科普|深度学习主流开发 -
去年我国露天煤矿产量首次突破10亿吨
从地区分布看,内蒙古和新疆两地的露天煤矿数量和产能占比分别达到全国 -
山东诸城市烟草:携手走上共富路
本报记者李健近日,潍坊诸城市贾悦镇岭南头村种烟能手张保余接到了林家 -
正荣地产:上半年预期将录得母公司拥有...
正荣地产8月10日在港交所公告,根据集团2023年上半年未经审核管理账目 -
国家发改委:督促地方建立失信惩戒制度...
App8月10日消息,国家发改委发布关于完善政府诚信履约机制优化民营经济 -
万万没想到|大屏知识分享 秒懂百科全书
责任编辑:房家辉分享到:版权声明:凡注明来源“流媒体网”的文章... -
神力股份并购“踩雷”后续:原交易方拟...
◎神力股份以近3亿元的价格收购并增资了一家公司,但在三年业绩承诺期 -
运动夜游两相宜 松江夏夜显魅力
对于跑步爱好者来说,避开炎热的白天,夜跑是一个非常不错的夏日运动选 -
鸡骨白玉盘玩多久能变色
鸡骨白玉盘是一种稀有的玉石,它的变色过程需要很长时间,可以是几年甚 -
印度老师涉嫌殴打学生后遭家长群殴:头...
海外网8月10日电据《今日印度》网站8月9日报道,当地时间8日,印度泰米 -
台风“卡努”将影响东北 江南江淮等地...
未来三天(8月10日至12日),我国降雨范围较广,东北、西北、华北、西 -
和田红玉原生籽料特征
?和田红玉原生籽料特征??颜色鲜艳,呈现出深红色或红褐色,闪耀着迷人 -
台风“卡努”登陆韩国 逾1.4万人疏散避险
中新社首尔8月10日电(记者刘旭)今年第6号台风“卡努”10日从韩国南... -
美股创三个月最差周表现 “牛市”戛然...
美股创三个月最差周表现“牛市”戛然而止?丨就市论市,美股,牛市,纳... -
种植面积逾14万亩!“阿拉尔核桃”成国...
中新网乌鲁木齐8月9日电(戚亚平王芳芳沈川江)9日记者从新疆生产建设 -
视频丨北京8月1日起雨势将减弱 公众仍...
过去24小时,北京大部出现了暴雨到大暴雨。今天(8月1日),北京的降雨 -
年产8000万平米!百佳年代咸阳基地二期签约
8月6日,在2023年咸阳市秦都区重大项目专场签约仪式上,百佳年代年产8000 -
一品翠翡翠紫罗兰手镯
一品翠翡翠紫罗兰手镯是一种精美的手镯,由高品质的翡翠和紫罗兰宝石制 -
奥运冠军王濛被带走调查?工作室最新回应
“王濛被冻结股权445万”话题今日登顶微博热搜。媒体报道称,天眼查... -
圆通速递宣布捐赠1000万元 支援防汛救...
“杜苏芮”台风带来的极端强降水在我国京津冀、东北等地引发严重洪...