அடிப்படை மொழிமாதிரிகளிலிருந்து அறிவு-திரட்டிய AI-க்கு: உண்மைகளை மறக்காமல் கற்றுக்கொடுப்பது எப்படி?
Solving AI Hallucination · Vector Databases · Factual Truth
இந்த அடிப்படை மாடலிடம் ஒரு குறிப்பிட்ட உண்மையைக் கேட்டால் (உதாரணமாக, "திருக்குறள் 1250 என்ன?"), அது எந்த தரவுத்தளத்திலும் தேடாது. மாறாக், அதிக நிகழ்தகவு (Statistical Probability) உள்ள வார்த்தைகளை அடுக்கி ஒரு பதிலை உருவாக்கும்.
இதுவே மாயத்தோற்றம் (Hallucination) எனப்படுகிறது. இது அதுவாகவே ஒரு போலி குறளை உருவாக்கி, அதுதான் உண்மை என்று 100% நம்பிக்கையுடன் சொல்லும். இது யூகங்களை உருவாக்கும் இயந்திரமே தவிர, உண்மைகளை அல்ல.
உண்மையான தரவுகளை Vector Database-இல் சேமிக்கிறோம். பயனர் கேள்வி கேட்கும்போது, கணிதவியல் மூலம் சரியான உண்மையைத் தேடுகிறோம்.
கண்டுபிடிக்கப்பட்ட உண்மையான தரவை AI-இன் Prompt-இல் அப்படியே சேர்க்கிறோம்.
AI தன் தவறான நினைவாற்றலை நம்பாமல், நாம் கொடுத்த உண்மையான தரவை மட்டும் வைத்துச் சிந்தித்து பதில் அளிக்கிறது.
யூகிக்க வேண்டாம், தேடுங்கள். பயனரின் கேள்வியை கணித வெக்டாராக மாற்றி, சரியான குறளை நமது தரவுத்தளத்தில் தேடுகிறோம்.
AI-யைக் கட்டுப்படுத்துகிறோம். உண்மையான குறளை Prompt-இல் செலுத்தி, அதை மட்டுமே வைத்துப் பதிலளிக்க உத்தரவிடுகிறோம்.
கேள்வி: "திருக்குறள் 433 என்ன?"
"தன்னம்பிக்கை இல்லார்க்கு வாழ்க்கை இல்லை
அதனால் துணிந்து முயல்வது நல்லது"
மாயத்தோற்றம்! இது திருக்குறளில் இல்லை!
கேள்வி: "திருக்குறள் 433 என்ன?"
"அஞ்சுவது அஞ்சாமை பேதைமை அஞ்சுவது
அஞ்சல் அறிவார் தொழில்"
100% துல்லியம்! தரவுத்தளத்திலிருந்து தேடப்பட்டது
அடிப்படை LLM: இலக்கணம் | உண்மைகள்
RAG அமைப்பு: இலக்கணம் | உண்மைகள்