Word Selection Assistant (智能划词助手) 🎯

一个基于 PyQt6 的智能文本处理助手，集成多模态 AI 能力，支持文本翻译、解释、总结和自定义功能处理。支持本地Ollama模型和OpenAI兼容API。

🆕 核心功能

📝 智能文本处理

🌍 文本翻译: 支持多语言智能翻译
💡 内容解释: 智能解释文本含义和背景
📋 内容总结: 自动提取文本要点和总结
📊 图表生成: 根据文本内容生成可视化图表
✨ 提示词优化: 优化用户输入的提示词
❓ 智能提问: 基于选中文本进行连续多轮对话
⚙️ 自定义功能: 个性化AI功能配置和模型选择

🤖 AI服务支持

Ollama本地模型: 保护隐私，离线使用，支持各种开源模型
OpenAI兼容API: 支持各种OpenAI兼容的服务提供商
iFlow CLI: 集成 iFlow SDK，支持智能任务规划和连续对话
- 支持 8 种 iFlow 模型（GLM-4.7、DeepSeek-V3.2、Kimi-K2 等）
- 智能工作流：翻译→解释→总结链式处理
- 连续对话：基于同一文本的多轮问答
灵活切换: 通过配置文件轻松切换AI提供商

🎯 自定义功能特性

提示词模板: 支持个性化AI提示词配置
模型选择: 支持多种本地和云端模型
智能工作流: 预定义工作流（翻译+解释+总结）和条件触发
连续对话: 基于选中文本的多轮问答，自动维护对话历史
设置持久化: 配置自动保存和加载
参数优化: 智能模型参数调整

快速开始

环境要求

Python 3.8+
Windows 10/11
Ollama (可选，如需使用本地模型)

安装依赖

cd word-selection-assistant
pip install -r requirements.txt

安装并运行Ollama (如需使用本地模型)

下载并安装Ollama: https://ollama.com/download
启动Ollama服务: ollama serve
拉取所需模型: ollama pull llama3.2 (或其他模型)

配置 API

编辑 .env 文件，配置你的 API 服务：

# Ollama 配置 (推荐 - 本地运行，无需API密钥)
OLLAMA_BASE_URL=http://localhost:11434/v1
OLLAMA_API_KEY= # Ollama通常不需要API密钥

# 或者 OpenAI兼容API 配置 (可选)
# OPENAI_API_KEY=your_api_key_here
# OPENAI_BASE_URL=https://api.openai.com/v1

注意: 如果同时配置了Ollama和OpenAI兼容API，可通过修改 config/settings.yaml 中的 default_provider 来选择默认服务提供商。

运行程序

python main.py

使用说明

基本使用

启动程序: 运行 python main.py，图标会出现在系统托盘
选择文本: 在任意应用中选择要处理的文字
快捷键: 按 Ctrl+Q 调出功能面板
选择功能: 点击对应功能按钮获得AI处理结果

连续对话提问

选中文本: 选择要咨询的文本内容
点击提问: 按 Ctrl+Q 后点击 "❓ 提问" 按钮
输入问题: 在弹出的对话框中输入你的问题
继续对话: 点击 "❓ 提问" 按钮可以继续基于同一文本提问
多轮交互: 系统会自动维护对话历史，支持上下文理解

智能工作流

使用工作流: 选择文本后，系统支持智能工作流处理
链式处理: 如 "翻译→解释→总结" 自动顺序执行
条件触发: 根据文本长度和内容自动选择处理步骤

自定义功能配置

打开设置: 点击功能面板中的"⚙️ 自定义"按钮
配置功能:
- 设置功能名称
- 编写个性化提示词模板（使用 {text} 作为文本占位符）
- 选择合适的AI模型
保存配置: 点击保存，设置立即生效

模型提供商切换

编辑配置: 修改 config/settings.yaml 文件
更改提供商: 修改 ai.default_provider 字段
- ollama: 使用本地Ollama模型
- openai: 使用OpenAI兼容API
重启程序: 使配置更改生效

项目结构

word-selection-assistant/
├── main.py                    # 程序入口
├── requirements.txt           # 依赖清单
├── .env                       # API密钥配置
│
├── config/
│   ├── settings.yaml          # 应用配置
│   └── prompt_templates.yaml  # AI提示词模板
│
├── ai/                        # AI相关模块
│   ├── xiaoma_adapter.py      # 小马算力API适配器
│   ├── openai_compatible.py   # OpenAI兼容接口
│   ├── iflow_adapter.py       # iFlow SDK适配器
│   ├── iflow_workflow.py      # iFlow工作流支持
│   ├── ollama_adapter.py      # Ollama本地模型适配器
│   └── prompt_generator.py    # 提示词生成器
│
├── core/                      # 核心功能模块
│   ├── function_router.py     # 功能路由器
│   ├── hotkey_manager.py      # 热键管理
│   └── text_capture.py        # 文本捕获
│
├── features/                  # 功能实现模块
│   ├── translator.py          # 翻译功能
│   ├── explainer.py           # 解释功能
│   ├── summarizer.py          # 总结功能
│   ├── custom_builder.py      # 自定义功能
│   ├── chart_generator.py     # 图表生成功能
│   ├── prompt_optimizer.py    # 提示词优化功能
│   └── question_asker.py      # 智能提问功能（支持连续对话）
│
├── ui/                        # 界面模块
│   ├── popup_window.py        # 悬浮窗
│   ├── tray_icon.py           # 系统托盘
│   └── settings_dialog.py     # 设置对话框
│
└── utils/                     # 工具模块
    ├── config_loader.py       # 配置加载器
    ├── config_manager.py      # 配置管理器
    ├── settings_manager.py    # 设置管理
    ├── thread_pool_manager.py # 线程池管理
    ├── event_loop_manager.py  # 事件循环管理
    └── logger.py              # 日志系统

配置说明

应用配置 (config/settings.yaml)

app:
  name: "智能划词助手"
  version: "2.0.0"
  log_level: "INFO"

hotkey:
  combination: "ctrl+q"  # 快捷键

ai:
  provider: "xiaoma"     # API提供商
  model: "qwen3-32b"     # 默认模型
  timeout: 30            # 超时时间(秒)
  api:
    enable_stream: true  # 启用流式输出
    stream_chunk_size: 100  # 流式输出缓冲区大小

features:
  translator:
    enabled: true
    auto_translate: false

  explainer:
    enabled: true
    # 支持Python代码级别解释
    show_level_buttons: true
    
  summarizer:
    enabled: true
    max_length: 500
    
  custom:
    enabled: true
    # 自定义配置存储位置
    config_file: "~/.word_selection_assistant/custom_settings.json"

自定义功能配置文件

用户配置自动保存在：~/.word_selection_assistant/custom_settings.json

格式示例：

{
  "prompt_template": "请对以下内容进行详细分析：\n\n{text}",
  "function_name": "内容分析",
  "model": "qwen3-32b",
  "timestamp": 1768731106
}

提示词模板 (config/prompt_templates.yaml)

translator: "请将以下文字翻译成{target_lang}：\n\n{text}"

explainer: "请解释以下单词的含义、用法并给出例句：\n\n{text}"

summarizer: "请对以下内容进行简洁总结（不超过100字）：\n\n{text}"

python_explainer: 
  default: "请解释以下Python代码的功能和实现原理：\n\n{text}"
  beginner: "请用简单易懂的方式解释以下Python代码，适合初学者理解：\n\n{text}"
  advanced: "请从架构设计角度深度分析以下Python代码：\n\n{text}"

功能特性

🔄 流式输出

流式输出功能让 AI 响应实时显示，显著提升用户体验。

特性：

✅ 翻译、解释、总结支持流式输出
✅ 自定义功能流式处理
✅ 实时显示处理进度

💬 连续对话

基于选中文本进行多轮问答，系统自动维护对话上下文。

特性：

✅ 自动维护对话历史（问题+回答）
✅ 上下文理解，支持追问
✅ 基于同一文本的多轮交互
✅ 对话完成后可继续新对话

🔄 智能工作流

支持预定义工作流，自动执行多步骤任务。

特性：

✅ 完整处理: 翻译→解释→总结链式执行
✅ 智能分析: 根据文本类型自动选择处理方式
✅ 代码理解: 针对代码片段的专用处理流程
✅ 条件触发: 根据文本长度、语言等条件自动选择步骤

🎯 级别化解释

针对代码解释功能提供专业级别选择：

👶 初级: 简单易懂，适合初学者
🔧 默认: 平衡深度的标准解释
🚀 高级: 架构设计和深层原理分析

⚙️ 高级自定义

提示词模板: 完全自定义AI处理逻辑
模型选择: 从20个专业模型中选择
配置持久化: 自动保存用户配置
参数验证: 智能参数验证和错误处理

架构设计

┌─────────────────────────────────────────────────────────────────┐
│                         main.py (入口)                           │
│              WordSelectionAssistant (主控制器)                   │
└────────────────────────────┬────────────────────────────────────┘
                             │
              ┌──────────────┼──────────────┐
              │              │              │
              ▼              ▼              ▼
    ┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐
    │   UI Layer      │ │  Core Layer     │ │   AI Layer      │
    │  (ui/)          │ │  (core/)        │ │  (ai/)          │
    │                 │ │                 │ │                 │
    │ - TrayIcon      │ │ - HotkeyManager │ │ - XiaomaAdapter │
    │ - PopupWindow   │ │ - TextCapture   │ │ - IFlowIntegration│
    │ - CustomSettings│ │ - FunctionRouter│ │ - PromptGenerator│
    └────────┬────────┘ └────────┬────────┘ └────────┬────────┘
             │                   │                   │
             ▼                   ▼                   ▼
    ┌─────────────────────────────────────────────────────────┐
    │              Features Layer (features/)                  │
    │   Translator  │  Explainer  │  Summarizer  │ Custom     │
    └─────────────────────────────────────────────────────────┘
                             │
                             ▼
    ┌─────────────────────────────────────────────────────────┐
    │            Utils Layer (utils/)                         │
    │ ConfigManager│ThreadPoolManager│EventLoopManager       │
    └─────────────────────────────────────────────────────────┘

性能优化

🚀 响应速度优化

EventLoop 复用: 消除每次请求的 10-50ms 开销
连接池复用: 减少 TCP 握手时间（50-100ms）
配置缓存: 配置信息智能缓存，减少I/O操作
异步处理: 全异步架构，避免UI阻塞

💾 内存优化

对象池: 复用UI对象和资源
延迟加载: 按需加载功能模块
垃圾回收: 及时释放不需要的资源

依赖说明

依赖	版本	用途
PyQt6	>=6.6.0	GUI框架和界面组件
openai	>=1.0.0	AI API调用和响应处理
aiohttp	>=3.9.0	异步HTTP请求处理
keyboard	>=0.13.5	全局热键监听
pywin32	>=306	Windows系统API集成
pyyaml	>=6.0.1	配置文件解析
python-dotenv	>=1.0.0	环境变量管理

AI模型说明

🎯 模型选择指南

项目支持多种AI模型，您可以根据需求选择：

本地模型 (Ollama): 保护隐私，无需网络连接，适合敏感数据处理，需要本地安装Ollama
云端模型 (OpenAI兼容API): 性能强大，功能丰富，需要网络连接和API密钥

📊 模型特性对比

本地 vs 云端: 本地模型保护隐私和离线使用，云端模型功能更全面
成本 vs 性能: 本地模型无需API费用但依赖本地硬件，云端模型按使用付费但性能更强
iFlow 集成: 通过 iFlow SDK 接入多种云端模型，支持智能任务规划
多语言支持: 大多数现代模型都支持多语言处理
响应速度: 本地模型响应更快（取决于硬件），云端模型取决于网络状况

🔌 iFlow SDK 集成

项目深度集成 iFlow CLI，提供更智能的 AI 交互体验。

支持的模型：

GLM-4.7 (推荐)
DeepSeek-V3.2
Qwen3-Coder-Plus
Kimi-K2-Thinking
MiniMax-M2.1
Kimi-K2.5
等 8+ 个专业模型

iFlow 特性：

✅ 智能任务规划和多步骤执行
✅ 条件分支和自动路由
✅ 对话历史自动维护
✅ SDK 自动管理进程和端口

常见问题

Q: 程序启动后没有反应

A: 检查系统托盘，程序运行后图标会出现在托盘区域。可能是托盘图标被隐藏了。

Q: Ctrl+Q 快捷键不生效

A:

确保当前有文本被选中
检查是否有其他程序占用该快捷键
尝试使用系统托盘图标右键菜单
确保以管理员权限运行程序

Q: API 调用失败

A:

如果使用Ollama: 确认Ollama服务正在运行 (ollama serve)，并已拉取所需模型
如果使用OpenAI兼容API: 检查 .env 文件中的 OPENAI_API_KEY 是否正确
确认网络连接正常
检查API服务商是否正常

Q: 模型找不到错误

A:

检查 config/settings.yaml 中配置的模型名称是否存在于本地Ollama中
使用 ollama list 命令查看本地可用模型
更新配置文件中的模型名称为实际存在的模型

Q: 自定义功能不生效

A:

确认提示词模板包含 {text} 占位符
检查选择的模型是否可用
查看日志文件获取详细错误信息

Q: 配置丢失

A: 配置文件位置：~/.word_selection_assistant/custom_settings.json

检查文件权限
重新配置自定义功能

开发指南

添加新功能

在 features/ 目录创建新的功能模块
实现异步处理方法
在 PopupWindow 中添加UI控件
在 FunctionRouter 中注册功能

自定义AI模型

修改 utils/config_manager.py 中的 AVAILABLE_MODELS
更新 ai/xiaoma_adapter.py 适配器
添加模型特性说明

扩展UI功能

修改 ui/popup_window.py 添加UI组件
更新样式表 CSS 样式
实现事件处理方法

更新日志

v2.2.0 (2026-02-13)

✨ iFlow SDK 集成: 深度集成 iFlow CLI，支持智能任务规划
💬 连续对话功能: 基于选中文本的多轮问答，自动维护对话历史
🔄 智能工作流: 支持预定义工作流和条件触发（翻译→解释→总结）
📊 图表生成: 根据文本内容自动生成可视化图表
✨ 提示词优化: 智能优化用户输入的提示词
🤖 模型扩展: 支持 GLM-4.7、DeepSeek-V3.2 等 8+ 个专业模型
🎯 架构优化: 重构 AI 适配器层，支持多种提供商灵活切换

v2.1.0 (2026-02-08)

✨ API提供商变更: 从专有API转向支持Ollama本地模型和OpenAI兼容API
🔧 新增: 本地Ollama模型支持
⚙️ 优化: 配置系统支持多种AI提供商
🌐 增强: 支持各种OpenAI兼容的服务提供商
🚀 性能: 本地模型响应更快，保护用户隐私
📱 UI: 优化模型选择和配置管理

v2.0.0 (2026-01-18)

✨ 重大更新: 全新自定义功能系统
🔧 新增: 20个专业AI模型支持
⚙️ 优化: 配置管理系统重构
🎯 增强: 流式输出全面优化
🚀 性能: 响应速度提升60%
🐛 修复: 配置保存和模型选择问题
📱 UI: 优化用户界面和交互体验

v1.0.0 (2026-01-07)

🎉 初始版本发布
🌍 支持翻译、解释、总结功能
⌨️ 实现系统托盘和全局热键
🔗 集成小马算力 TokenPony API

贡献指南

欢迎提交 Issue 和 Pull Request！

Fork 项目
创建功能分支
提交更改
推送到分支
创建 Pull Request

致谢

特别感谢以下项目和工具的支持：

iFlow CLI - 提供强大的 AI SDK 支持，实现智能任务规划和连续对话功能

许可证

MIT License

🎯 专注于AI驱动的智能文本处理，让工作更高效！

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
ai		ai
charts		charts
config		config
core		core
features		features
tests		tests
ui		ui
utils		utils
.env.example		.env.example
.gitignore		.gitignore
AGENTS.md		AGENTS.md
CHANGELOG.md		CHANGELOG.md
CONFIG_GUIDE.md		CONFIG_GUIDE.md
README.md		README.md
main.py		main.py
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
temp_image.png		temp_image.png

Folders and files

Latest commit

History

Repository files navigation

Word Selection Assistant (智能划词助手) 🎯

🆕 核心功能

📝 智能文本处理

🤖 AI服务支持

🎯 自定义功能特性

快速开始

环境要求

安装依赖

安装并运行Ollama (如需使用本地模型)

配置 API

运行程序

使用说明

基本使用

连续对话提问

智能工作流

自定义功能配置

模型提供商切换

项目结构

配置说明

应用配置 (config/settings.yaml)

自定义功能配置文件

提示词模板 (config/prompt_templates.yaml)

功能特性

🔄 流式输出

💬 连续对话

🔄 智能工作流

🎯 级别化解释

⚙️ 高级自定义

架构设计

性能优化

🚀 响应速度优化

💾 内存优化

依赖说明

AI模型说明

🎯 模型选择指南

📊 模型特性对比

🔌 iFlow SDK 集成

常见问题

Q: 程序启动后没有反应

Q: Ctrl+Q 快捷键不生效

Q: API 调用失败

Q: 模型找不到错误

Q: 自定义功能不生效

Q: 配置丢失

开发指南

添加新功能

自定义AI模型

扩展UI功能

更新日志

v2.2.0 (2026-02-13)

v2.1.0 (2026-02-08)

v2.0.0 (2026-01-18)

v1.0.0 (2026-01-07)

贡献指南

致谢

许可证

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages