人工智能 #LLM

解决 Dify 无法解析 .doc 文件：私有化部署 Unstructured API

在 LLM 应用开发领域，Dify 作为开源的开发平台，凭借其灵活的功能和易用性，成为众多开发者构建 AI 应用的首选工具。然而，在实际使用过程中，不少用户发现 Dify 内置的文档提取器在处理特定文件格式时存在明显局限性，其中Word 2003 格式（.doc 文件）的支持问题尤为突出 —— 当尝

Published on 2025-09-11

人工智能 #Cursor #LLM #AI #MCP

Cursor 实践经验分享（持续更新）

Cursor 是一个基于人工智能的代码编辑器（IDE），它结合了传统编辑器的功能和强大的 AI 辅助功能。它能帮助开发者更快地编写代码，通过智能自动完成、代码生成、问答交互等功能提高编程效率。官网：https://www.cursor.com/cn 文档：https://docs.cursor.c

Published on 2025-08-14

人工智能 #MCP #LLM

MCP联合创建者：MCP不止工具调用，可以更丰富

上周末，Anthropic 一口气放出了很多内部核心贡献工程师的分享。他们把 MCP 协议的设计哲学、开发技巧、未来计划也同步放了出来。如今，没有哪家大厂不拥抱 MCP。不止国内的阿里、字节、腾讯、百度、京东，即便是国外的即便是 Anthropic 死对头的 OpenAI 也表示全面支持 MCP

Published on 2025-08-07

人工智能 #AI #LLM

开源版 Coze 和 Dify 的深度技术与架构对比

随着 Coze 的开源，很多圈内的小伙伴猜测会对 Dify 造成直接威胁，也看到不少关于本地部署 Coze 的例子。本文从项目代码出发，从产品理念，架构设计，应用开发，技术栈对比，部署，生态，企业场景选择分析等方面进行一个全面的对比代码地址：

Published on 2025-08-05

人工智能 #AI #LLM #MCP

MCP 优雅加载服务器中的数据和内容：Resources 详解

资源是模型上下文协议（MCP）中的一种核心基本元素，它使服务器能够公开数据和内容，这些数据和内容可供客户端读取，并用作大语言模型（LLM）交互时的上下文信息。官方文档：https://modelcontextprotocol.io/docs/concepts/resources 一、资源简介（一

Published on 2025-03-21

人工智能 #AI #LLM #MCP

MCP 客户端访问远程服务器：Transports 详解

模型上下文协议（MCP）中的 Transports（传输）为客户端和服务器之间的通信提供了基础。传输处理消息发送和接收方式的基本机制。一、消息格式 Transports 底层的消息消息格式，一般情况下无需开发者关心。我们简单了解一下。 MCP 使用 JSON-RPC 2.0 作为其传输格式。传

Published on 2025-03-20

人工智能 #AI #LLM #MCP

MCP 开发快速入门：构建你的专属 Client 和 Server

本文参考官方案例，使用 Node.js 语言，从零开始构建一个 MCP Server 和一个 MCP Client，并基于标准 IO 实现本地调用。官方文档：https://modelcontextprotocol.io/quickstart/server 一、开发 MCP Server 基于美国

Published on 2025-03-19

人工智能 #AI #LLM #MCP

MCP 原理与实战：模型上下文协议的奥秘

MCP，即 Model Context Protocol（模型上下文协议），是 Anthropic 推出的一项开放标准。其核心目标是统一大型语言模型（LLM）与外部数据源及工具之间的通信协议。在当下，AI 模型常受数据孤岛问题制约，难以充分释放潜力，MCP 的出现正是为攻克这一难题。它赋予 AI 应

Published on 2025-03-19

人工智能 #AI #LLM

从零开始的 DeepSeek 微调训练实战（SFT）

本文重点介绍使用微调框架unsloth，围绕DeepSeek R1 Distill 7B模型进行高效微调，并介绍用于推理大模型高效微调的COT数据集的创建和使用方法，并在一个medical-o1-reasoning-SFT数据集上完成高效微调实战，并最终达到问答风格优化&知识灌注目的。你能收获什么

Published on 2025-03-13

人工智能 #AI #LLM

Xinference 本地部署 Rerank 模型，提高检索结果准确性

Rerank 指的是重排序模型，在信息检索、自然语言处理等领域有着重要作用。可以有效的提高检索结果准确性、融合多源信息、提升模型性能、挖掘潜在语义关系、平衡召回率和精确率。一、Xinference 安装 Xinference‌ 是一个性能强大且功能全面的分布式推理框架，特别适用于大语言模型（LLM

Published on 2025-02-24

人工智能 #AI #LLM

解锁免费且强大的 Web Search 方案：Firecrawl 部署并接入 Dify

Firecrawl 是一项 API 服务。它能够获取 URL，对相应的网页进行抓取操作，并将抓取到的内容转换成格式规范的 Markdown 格式文本或者结构化数据。可以实现对所有能够访问到的子页面进行抓取，并且为每个子页面提供格式规范、清晰的数据。使用该服务无需站点地图。官方服务地址：https

Published on 2025-02-21

人工智能 #AI #LLM

Dify 私有化部署教程，一款强大的开源大模型开发平台

Dify 是一个开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、Agent、模型管理、可观测性功能等。官方平台：https://dify.ai/zh 开源社区版：https://github.com/langgenius/dify 一、使用 Docker Compos

Published on 2025-02-20

人工智能 #AI #LLM

Linux 系统手动安装 Ollama 详细教程

由于国内网络环境，Ollama 的自动安装脚本在服务器上经常网络超时。可以参考本文的手动安装方式。 Linux 自动安装命令：curl -fsSL https://ollama.com/install.sh | sh Linux 手动安装官方文档参考：https://github.com/ollam

Published on 2025-02-19

人工智能 #AI #LLM

Open WebUI（原 Ollama WebUI）安装体验，附国内安装建议

Open WebUI 是一个可扩展、功能丰富且用户友好的自托管 AI 平台，旨在完全离线运行。它支持各种LLM运行器，如 Ollama 和 OpenAI 兼容的 API，并内置了 RAG 推理引擎，是一个强大的 AI 部署解决方案。开源地址：https://github.com/open-webu

Published on 2025-02-19

人工智能 #AI #LLM

号称 1.5B 战胜 o1-preview 只需使用 RL，DeepScaleR 模型部署体验

近日，来自 UC 伯克利的研究团队基于 Deepseek-R1-Distilled-Qwen-1.5B，通过简单的强化学习（RL）微调，得到了全新的 DeepScaleR-1.5B-Preview。训练细节目前，研究团队已开源数据集、代码和训练日志。开源地址：https://github.co

Published on 2025-02-18

人工智能 #LLM #AI

基于 Ollama 和 SpringAI 实现私有化知识库的思路

使用 Ollama 作为大模型能力基座官网：https://ollama.com/ GitHub：https://github.com/ollama/ollama 安装 Ollama 各平台下载地址：https://ollama.com/download 也可使用 Docker 部署：https:

Published on 2025-02-11

人工智能 #LLM #AI

AI 教父 Hinton：AI 可复制人类心智，或加剧全球贫富差距

2024年6月7日，AI 教父杰弗里·辛顿（Geoffrey Hinton）在联合国 AI for Good 大会上分享了 AI 在医疗和教育领域的潜力、网络犯罪和假视频的威胁以及提倡建立更严格的监管框架等话题。这场对谈共46分钟。主要观点此次对谈中，Hinton 有很多令人深思的金句与观点：

Published on 2025-02-07

人工智能 #LLM #macOS

macOS 上使用 MLX 微调 qwen2.5-0.5B

一、环境准备安装 python 详细过程省略，官网地址：https://www.python.org/ 安装 huggingface_hub 依赖 pip install -U huggingface_hub 设置代理环境变量 export HF_ENDPOINT=https://hf-mirr

Published on 2025-01-17

人工智能 #算法

余弦相似度的原理和应用场景

定义余弦相似度（Cosine Similarity）是一种用于衡量两个非零向量之间相似程度的指标。其基本原理是通过计算两个向量夹角的余弦值来判断它们的相似性。具体而言，余弦相似度被定义为两个向量的点积与它们的范数乘积之比，其公式为： \text{余弦相似度} = \cos(\theta) = \f

Published on 2025-01-15

Menu

解决 Dify 无法解析 .doc 文件：私有化部署 Unstructured API

Cursor 实践经验分享（持续更新）

MCP联合创建者：MCP不止工具调用，可以更丰富

开源版 Coze 和 Dify 的深度技术与架构对比

MCP 优雅加载服务器中的数据和内容：Resources 详解

MCP 客户端访问远程服务器：Transports 详解

MCP 开发快速入门：构建你的专属 Client 和 Server

MCP 原理与实战：模型上下文协议的奥秘

从零开始的 DeepSeek 微调训练实战（SFT）

Xinference 本地部署 Rerank 模型，提高检索结果准确性

解锁免费且强大的 Web Search 方案：Firecrawl 部署并接入 Dify

Dify 私有化部署教程，一款强大的开源大模型开发平台

Linux 系统手动安装 Ollama 详细教程

Open WebUI（原 Ollama WebUI）安装体验，附国内安装建议

号称 1.5B 战胜 o1-preview 只需使用 RL，DeepScaleR 模型部署体验

基于 Ollama 和 SpringAI 实现私有化知识库的思路

AI 教父 Hinton：AI 可复制人类心智，或加剧全球贫富差距

macOS 上使用 MLX 微调 qwen2.5-0.5B

余弦相似度的原理和应用场景

解锁免费且强大的 Web Search 方案：Firecrawl 部署并接入 Dify

MCP 开发快速入门：构建你的专属 Client 和 Server

Linux 系统手动安装 Ollama 详细教程

如何正确使用肌酸？

Open WebUI（原 Ollama WebUI）安装体验，附国内安装建议

macOS Sequoia WebThumbnailExtension 进程高占用问题修复

Xinference 本地部署 Rerank 模型，提高检索结果准确性

MCP 优雅加载服务器中的数据和内容：Resources 详解

Linux 查询端口占用情况

在 macOS 系统 Git 中忽略 .DS_Store 文件的最佳实践