介绍 llamafile

特别感谢 Mozilla 互联网生态系统 (MIECO) 的 Justine Tunney,她共同撰写了这篇博文。

今天我们宣布 llamafile 的第一个版本发布,并邀请开源社区参与这个新项目。

llamafile 允许您将大型语言模型 (LLM) 权重转换为可执行文件。

假设您有一组以 4GB 文件形式存在的 LLM 权重(使用常见的 GGUF 格式)。使用 llamafile,您可以将该 4GB 文件转换为可在六个操作系统上运行的二进制文件,无需安装。

这极大地简化了 LLM 的分发和运行。这也意味着,随着模型及其权重格式随着时间的推移而不断发展,llamafile 为您提供了一种方法,确保给定的权重集永远保持可用,并且始终如一地、可重复地执行。

我们通过结合我们喜欢的两个项目实现了这一切: llama.cpp(领先的开源 LLM 聊天机器人框架)与 Cosmopolitan Libc(一个开源项目,使 C 程序能够在大量平台和架构上进行编译和运行)。当然,在这个过程中也需要解决一些有趣且棘手的问题,例如在 Cosmopolitan 中添加 GPU 和 dlopen() 支持;您可以在 项目的 README 中阅读更多相关内容。

llamafile 的第一个版本是 Mozilla 创新小组的产物,由 Justine Tunney开发,她是 Cosmopolitan 的创建者。Justine 最近一直通过 MIECO 与 Mozilla 合作,并通过该计划,Mozilla 为她对 3.0 版本Hacker News 讨论)的开发工作提供了资金支持。对于 llamafile,Justine 很高兴能更直接地为 Mozilla 项目做出贡献,我们也很高兴有她参与。

llamafile 使用 Apache 2.0 许可证,我们鼓励贡献。我们对 llama.cpp 本身的更改使用 MIT 许可证(与 llama.cpp 本身使用的许可证相同),以便于将来可能进行的任何上游整合。我们都是 llama.cpp 的忠实粉丝,如果没有它和 Cosmopolitan,llamafile 就不会诞生。

我们希望 llamafile 对您有所帮助,并期待您的 反馈意见

 

 

关于 Stephen Hood

Stephen 在 Mozilla Builders 领导开源 AI 项目(包括 llamafile)。他之前管理过社会化书签先驱 del.icio.us;共同创办了 Storium、Blockboard 和 FairSpin;并在雅虎搜索和 BEA WebLogic 工作过。

更多 Stephen Hood 的文章…