今天帮一个客户调了一上午的RAG系统。90%的问题不是模型不行——是文档结构太烂。
PDF里有表格没识别、标题层级乱套、中英文混排没处理好。模型再强,喂进去的都是垃圾,吐出来的只能是垃圾。
说白了一个道理:AI落地最难的不是模型,是数据工程。
AI RAG 数据工程
今天帮一个客户调了一上午的RAG系统。90%的问题不是模型不行——是文档结构太烂。
PDF里有表格没识别、标题层级乱套、中英文混排没处理好。模型再强,喂进去的都是垃圾,吐出来的只能是垃圾。
说白了一个道理:AI落地最难的不是模型,是数据工程。
AI RAG 数据工程