奔腾2 CPU+128MB内存成功运行Llama大模型:速度还挺快
12月30日消息,奔腾据媒体报道,存成EXO Labs最近发布了一段视频,功运展示了在一台26年历史的行L型速Windows 98奔腾2 PC上运行大模型(LLM)。
这台主频350MHz电脑成功启动进入Windows 98系统,大模度还随后EXO启动了基于Andrej Karpathy的挺快Llama2.c定制的纯C推理引擎,并要求LLM生成关于“Sleepy Joe”的奔腾故事,令人惊讶的存成是生成速度相当可观。
EXO Labs的功运这一壮举并非偶然,该组织自称为“民主化AI”而生,行L型速由牛津大学的大模度还研究人员和工程师组成,他们认为,挺快少数大型企业控制AI对文化、奔腾真理和社会的存成其他基本方面是不利的。
因此,功运EXO希望建立开放的基础设施,训练前沿模型,并使任何人在任何地方都能运行它们,这项在Windows 98上的AI演示,展示了即使在资源极其有限的情况下也能完成的事情。
EXO Labs在文章中详细描述了在Windows 98上运行Llama的过程,他们购买一台旧的Windows 98 PC作为项目基础,但面临了许多挑战。
将数据传输到老设备上就是一个不小的挑战,他们不得不使用“老式的FTP”通过古老机器的以太网端口进行文件传输。
编译现代代码以适应Windows 98可能是一个更大的挑战,EXO找到了Andrej Karpathy的llama2.c,可以总结为“700行纯C代码,可以运行Llama 2架构模型的推理”,Karpathy曾是特斯拉的AI主管,也是OpenAI的创始团队成员。
利用这个资源和旧的Borland C++ 5.02 IDE和编译器(以及一些轻微的调整),代码可以被制作成Windows 98兼容的可执行文件并运行,GitHub上有完成代码的链接。
使用260K LLM和Llama架构在Windows 98上实现了“35.9 tok/s”的速度,根据EXO的博客,升级到15M LLM后,生成速度略高于1 tok/s,Llama 3.2 1B的速度则慢得多,为0.0093 tok/s。
- ·32T低算力能实现城市领航!大疆车载做到了:将免费推送
- ·内部消息,陈列室是️侠,能骑扣,能盖帽,有禁区防守大师
- ·微星龙盾局成都站燃情收官 2024年度盛宴圆满落幕
- ·[流言板]彻底爆发!华盛顿追身造成三分犯规,首节已经砍下19分
- ·记者:皇马今日开始备战联赛 姆巴佩今日将检查左腿伤势
- ·德转右边锋身价排行:亚马尔1.5亿欧第一,福登1.4亿欧第三
- ·内部消息,陈列室外号有一个字丹,保真。
- ·多举措为商家降成本 抖音电商332个产业带订单量超千万
- ·第103届日本全国高中足球锦标赛今日开赛,揭幕战帝京vs京都橘
- ·现在王朝真有必要玩吗
- ·那不勒斯总监:达尼洛很强但还是尤文的球员,目前没有在谈判
- ·泪目!159年老队复兴:夺5连胜+30年后再登英超第2 重返欧冠有戏
- ·36岁前日本国脚乾贵士与清水鼓动续约,30场5球8助帮球队重回J1
- ·[流言板]风水轮流转!骑士已经连续两个赛季完成对勇士的横扫
- ·hs去pero的话,4am直接秒了xbei+小五算了,按照小五的性格,给他配个北
- ·鸿蒙原生版搜狗输入法上架 已具备核心输入功能 还能开启按键音