MiMo-7B:解锁语言模型推理潜力的创新实践
在人工智能领域,语言模型的推理能力一直是研究的热点和难点。近期,小米 LLM-Core 团队推出了一款名为 MiMo-7B 的大型语言模型,它在推理任务上表现出色,通过优化预训练和后训练阶段,展现了巨大的潜力。
在人工智能领域,语言模型的推理能力一直是研究的热点和难点。近期,小米 LLM-Core 团队推出了一款名为 MiMo-7B 的大型语言模型,它在推理任务上表现出色,通过优化预训练和后训练阶段,展现了巨大的潜力。
记录一下使用Nginx代理Gemini,可以大陆访问和调用Gemini
记录一下实操Open-R1,GRPO的实现,基于Qwen-1.5B-Instruct。
利用服务器公网IP和域名,通过简单的Python代码实现Twikoo评论中的图片功能。
教程不一定适用所有,截至20250304可以正常使用,提供可以使用的版本下载链接。
大模型基础知识复习
由于百度很多的网站不能搜到官网,所以在此做部分记录。 一些常用的官方网站or其他网站记录。。
记录2025面试找工作刷题。。。。。
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, yo...