1.7k 字

MiMo-7B:解锁语言模型推理潜力的创新实践

在人工智能领域,语言模型的推理能力一直是研究的热点和难点。近期,小米 LLM-Core 团队推出了一款名为 MiMo-7B 的大型语言模型,它在推理任务上表现出色,通过优化预训练和后训练阶段,展现了巨大的潜力。

# 随笔
 403 字

use_nginx_as_proxy_for_gemini

记录一下使用Nginx代理Gemini,可以大陆访问和调用Gemini

# 随笔
 299 字

Record_OpenR1_GRPO

记录一下实操Open-R1,GRPO的实现,基于Qwen-1.5B-Instruct。

# 学习
 1.3k 字

基于Python的Twikoo图床简单实现

利用服务器公网IP和域名,通过简单的Python代码实现Twikoo评论中的图片功能。

默认# 随笔
 475 字

Typora最新版免费激活

教程不一定适用所有,截至20250304可以正常使用,提供可以使用的版本下载链接。

默认# 随笔
 1.4k 字

大模型基础知识复习-LLMs-Norm

大模型基础知识复习

学习# LLM# Normalization# NLP
 198 字

常用官方网站记录

由于百度很多的网站不能搜到官网,所以在此做部分记录。 一些常用的官方网站or其他网站记录。。

默认# 随笔
 854 字

LeetCode刷题记录

记录2025面试找工作刷题。。。。。

学习# Codes# Python
 76 字

Hello World

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, yo...

默认# 随笔

© Chasing Powered by Hexo Theme Stellar 1.29.1
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。

本站由丘盾系统丘盾系统提供CDN加速

| 总访问量12204次 | 总访客数人次

发表了 9 篇文章 · 总计 6.8k 字