近日,来自 UC 伯克利的研究团队基于 Deepseek-R1-Distilled-Qwen-1.5B,通过简单的强化学习(RL)微调,得到了全新的 DeepScaleR-1.5B-Preview。 训练细节 目前,研究团队已开源数据集、代码和训练日志。 开源地址:https://github.co
使用 Ollama 作为大模型能力基座 官网:https://ollama.com/ GitHub:https://github.com/ollama/ollama 安装 Ollama 各平台下载地址:https://ollama.com/download 也可使用 Docker 部署:https:
2024年6月7日,AI 教父杰弗里·辛顿(Geoffrey Hinton)在联合国 AI for Good 大会上分享了 AI 在医疗和教育领域的潜力、网络犯罪和假视频的威胁以及提倡建立更严格的监管框架等话题。这场对谈共46分钟。 主要观点 此次对谈中,Hinton 有很多令人深思的金句与观点:
一、环境准备 安装 python 详细过程省略,官网地址:https://www.python.org/ 安装 huggingface_hub 依赖 pip install -U huggingface_hub 设置代理环境变量 export HF_ENDPOINT=https://hf-mirr
定义 余弦相似度(Cosine Similarity)是一种用于衡量两个非零向量之间相似程度的指标。其基本原理是通过计算两个向量夹角的余弦值来判断它们的相似性。具体而言,余弦相似度被定义为两个向量的点积与它们的范数乘积之比,其公式为: \text{余弦相似度} = \cos(\theta) = \f