大模型让让,小模型登场丨科创要闻
4 月 23 日,大模登场微软推出小语言模型(SLM)Phi-3系列,型让有Phi-3-mini、模型Phi-3-small、丨科Phi-3-medium三个版本,创闻在评估语言、大模登场编程、型让数学能力等的模型基准测试中,Phi-3系列模型表现优于同等规模甚至更大规模模型(如GPT-3,丨科5)。微软称其是创闻目前同类中最强大且最具成本效益的小型语言模型。 Phi-3模型的大模登场“小体积”,让手机上运行高能力的型让语言模型成为可能。如Phi-3-mini只占用手机18GB内存,模型如在iPhone 14上部署,丨科苹果的创闻A16仿生芯片在设备上脱机运行,可以实现每秒超过12个token。 自2022年12月ChatGPT爆火之后,科技公司们一头扎进了大型模型的竞争,2023年接连刷新模型参数,2024年开始“内卷”长文本。大家似乎默认数据越多、参数越大、算力越强,模型的能力越强。 但是,高昂的运行成本、具体场景模型调试难度等问题,让大模型商业化的路径慢下来。此时小模型的优势就体现出来了。 小模型,目前某些领域也能接近大模型的性能。特别是在各手机和PC厂商正在力推的AIPC、AI手机上,对设备计算能力、运行能力、储存能力要求较低,能在地化运行的小模型,的确是不错的选择。 其实早在2023年6月份,微软就发布了第一代Phi模型,Phi-3系列已经是其第四代产品。近期,苹果公司也凑了小模型的热闹。 2024年4月24日,在大模型上没有什么动静的苹果公司,发布开源小语言模型OpenELM,包括
- 最近发表
- 随机阅读
-
- 市场监管行风建设在行动|吉林延边:聚焦重点领域 让市场监管有序有力
- 5年期以上LPR报价创历史最大降幅100万元房贷30年累积月供可减少3.2万元
- 快讯:猴痘概念股持续活跃之江生物涨停
- 华统股份:证监会核准公司非公开发行不超1.32亿股新股
- 北京市少年宫“奇妙自然”一日夏令营举办
- 5月20日午间涨停分析
- 立方数科:股东樊立拟减持不超过6%
- 商务部:全力以赴稳住外贸外资基本盘
- 中国光大集团股份公司原党委书记、董事长唐双宁接受审查调查
- 挪威斯瓦尔巴群岛发生6.0级地震震源深度10公里
- 德国、卡塔尔签署能源领域伙伴关系协议
- 天齐锂业:参股公司SQM一季度实现净利润7.96亿美元
- 新标准产品推送:热销+上新,满足您的生活饮用水检测需求(四)
- 收评:沪指大涨1.6%收复3100点北向资金全天净买入超百亿
- 欧盟拨款资助卢森堡和芬兰因对俄制裁受损失的企业
- Airres推出元宇宙硬件
- 逐一实测50家机构投教产品,喜忧各是什么?丨基金投教测评③
- 越南劳动力不再“廉价”月薪3000无人应聘
- 标普500指数盘中翻红此前跌超1%
- 黄海海域发生3.3级地震
- 搜索
-
- 友情链接
-