Python+Ollama:自动化拆单工具
Python+Ollama:自动化拆单工具
最近帮客户解决了一个痛点:每天要处理几百条非结构化的订单文本(如 "夹心 C 12,单根 0.20C 8-12"),手动录入 Excel 耗时且容易出错。
与其手动硬刚,不如写个工具自动跑。分享一下这个“本地化自动化拆单”工具的实现思路。💻
🛠️ **技术栈揭秘 (Tech Stack)**
* **开发语言**: Python 3.10
* **GUI 框架**: Tkinter (原生库,轻量级,打包体积小) 🖥️
* **本地模型**: Ollama + Gemma 3:12b (Google 最新开源模型,逻辑推理强) 🧠
* **数据处理**: Pandas + OpenPyXL (Excel 读写与清洗) 📊
* **打包分发**: PyInstaller (生成 .exe 可执行文件) 📦
⚙️ **核心实现思路**
1. **Two-Step 提取策略**:直接提取容易遗漏。我设计了分步逻辑:先提取基础属性(如翘度),再根据翘度动态注入对应的型号列表给模型,大幅减少了模型幻觉 (Hallucination)。
2. **Regex Fallback**:虽然大模型很强,但偶尔也会输出非 JSON 格式。我在代码里加了正则兜底,确保程序不会因为模型“调皮”而报错。
3. **UI 交互优化**:使用多线程 (Threading) 处理耗时任务,防止界面卡死,并实现了实时日志回显。
⚡️ **效果**
原本 3 小时的人工工作量,工具运行 5 秒钟搞定,准确率 99%。最重要的是**完全本地运行**,数据不出门,安全且免费。
#办公软件 #软件开发
👇 **交流探讨**
如果你对 Python 自动化办公、本地大模型应用感兴趣,或者也有类似的数据清洗难题,欢迎评论区交流技术细节!💬