在模型被使用的期間和對話越拉越長之後,AI 的回應會開始產生幻覺(hallucination),讓精準度顯著下降
幻覺的原因有可能源自數據,也可能是因為訓練的關係。透過 Embedding 將複雜的概念向量化,變成數字列組成的向量來讓模型理解
有業者針對串接 OpenAI API 的模型加以 embedding,實現精準度極高且不會鬼亂扯的商業實務可行工具
聚焦的重點可能可以開始從大型模型供應商往細部差異化的調教供應商去看,如某特定領域若出現專業的資料庫服務商,轉錢出來的速度應該很快
https://www.linkedin.com/pulse/navigating-ai-landscape-understanding-fine-tuning-embedding-mangin-9ktxc/
https://tako-analytics.com/2023-09-28-data-science-embedding-and-vector-database-series-1-what-is-embedding/
幻覺的原因有可能源自數據,也可能是因為訓練的關係。透過 Embedding 將複雜的概念向量化,變成數字列組成的向量來讓模型理解
有業者針對串接 OpenAI API 的模型加以 embedding,實現精準度極高且不會鬼亂扯的商業實務可行工具
聚焦的重點可能可以開始從大型模型供應商往細部差異化的調教供應商去看,如某特定領域若出現專業的資料庫服務商,轉錢出來的速度應該很快
https://www.linkedin.com/pulse/navigating-ai-landscape-understanding-fine-tuning-embedding-mangin-9ktxc/
https://tako-analytics.com/2023-09-28-data-science-embedding-and-vector-database-series-1-what-is-embedding/