Minimind 模型结构

研究一下 Minimind 的模型结构

HKU GPU Farm 指北

简单记录一下一些操作

C/C++ 程序崩溃分析:coredump

无用的小知识 +1 .jpg

LightRAG: 构建索引 insert() 方法深入探究

做项目需要深入一下 rag.insert() 方法的流程以便复现,虽然大多数的总结性的内容都是由 Claude 3.7 完成的,但还是用一篇文章记录一下整个流程,加深一下印象

Django REST API 框架

REST 的六大设计约束 客户端-服务器架构 分离职责:客户端与服务器完全解耦,各自独立演化。 优势:提升可扩展性,简化服务器端复杂度,允许客户端灵活更新。 无状态性 定义:服务器不保存客户端会话状态,每次请求必须包含完整上下文。 实...

异步编程

学习 Python 和 Javascript 中的异步编程

大模型实战:预训练

以 Minimind 为例子,研究如何进行模型预训练

llama.cpp server 端的 API

llama-server 参数

OpenAI 流式传输与 StreamLit

流式传输 大模型的 API 通常都支持流式传输。所谓流式传输,就是指将大模型生成的文字拆分成一小块一小块发送过来,比如说每隔 555 秒就发送一次生成的文字,而不是等文字全部生成完毕才一次性全部发送。 这样做的好处在于 langchain lan...

Python 并行库 joblib

做 Machine Learning 的时候数据量比较多,合适使用 joblib 库,最大化利用 CPU Core,能够大幅减少运行时间

134567