AI, Machine Learning, Deep Learning மற்றும் Generative AI-இன் மாயாஜால உலகம்
தொழில்நுட்பப் பொது விரிவுரை
செய்யறிவு (AI) இன்று நமது வாழ்வின் ஒவ்வொரு இழையிலும் பின்னிப் பிணைந்துவிட்டது. ஆனால், மாயாஜாலத் திரைக்குப் பின்னால் ஒளிந்திருக்கும் உண்மை என்ன?
ஒரு பொதுவான குழப்பம்:
பெரும்பாலானோர் AI, Machine Learning, Deep Learning ஆகிய வார்த்தைகளை ஒரே அர்த்தத்தில் பயன்படுத்துகிறார்கள். ஆனால், அவை ஒவ்வொன்றும் வேறுபட்டவை; அதே சமயம் ஒன்றோடொன்று பிரிக்க முடியாதவை.
இந்தக் குழப்பத்தைத் தீர்க்க, ஒரு சிறந்த உவமையை நாம் துணைக்கு அழைப்போம்!
ஒன்றுக்குள் ஒன்றாகப் பொருத்தப்பட்டிருக்கும் ரஷ்யாவின் புகழ்பெற்ற மரப் பொம்மைகளை (Matryoshka dolls) கற்பனை செய்துபாருங்கள்.
இவை தனித்தனித் தீவுகள் அல்ல. ஒன்றுக்குள் ஒன்றாகப் பின்னிப் பிணைந்திருக்கும் அறிவின் அடுக்குகள்.
செய்யறிவு (AI): இதை ஒரு தனிப்பட்ட மென்பொருள் என்று நினைத்துவிடாதீர்கள். இது எல்லாவற்றையும் தனக்குள் அடக்கிய ஒரு ‘மாபெரும் குடை’ (Umbrella Term).
மனிதனைப் போலவே சிந்திக்கவும், திட்டமிடவும், மொழியைப் புரிந்து கொள்ளவும், சில சமயங்களில் நம்மை விடச் சிறப்பாகச் செயல்படவும் கூடிய இயந்திரங்களை உருவாக்குவதே இதன் மாபெரும் தேடல்.
“ஸ்பெஷலிஸ்ட்”
இன்று நாம் பயன்படுத்தும் அனைத்து AI-களும் இந்த வகையே.
“ஆல் ரவுண்டர்”
இதுதான் AI ஆராய்ச்சியின் புனிதக் கிண்ணம் (Holy Grail).
| பள்ளி 1: குறியீட்டு AI (Symbolic AI) | பள்ளி 2: மெஷின் லேர்னிங் (Machine Learning) |
|---|---|
| “கறார் வாத்தியார் முறை” | “ஸ்மார்ட் மாணவன் முறை” |
| மனித அறிவை அப்படியே விதிகளாக (Rules) மாற்றி கணினிக்குப் புகட்டுதல். | விதிகளைச் சொல்லிக் கொடுக்காமல் தரவுகளைக் (Data) கொடுத்துக் கற்க வைத்தல். |
| IF நோயாளிக்கு காய்ச்சல் THEN பாராசிட்டமால் கொடு (Expert Systems). | ஆயிரக்கணக்கான படங்களைக் காட்டி 'இது பூனை' எனக் கற்றுக் கொடுத்தல். |
| தெளிவான கட்டமைப்பு & லாஜிக் வழங்குகிறது. | நெகிழ்வுத்தன்மையையும், முடிவற்ற கற்கும் திறனையும் வழங்குகிறது. |
2022-ம் ஆண்டு, கொலராடோ கலைக் கண்காட்சியில் முதல் பரிசை வென்ற ஓவியத்தை வரைந்தது ஒரு மனிதர் அல்ல, Midjourney என்ற AI.
இது எழுப்பிய கேள்விகள்:
இது சும்மா ஒரு தொழில்நுட்பம் அல்ல; கணினி வரலாற்றின் ‘பழைய ஏற்பாட்டை’ கிழித்து எறிந்துவிட்டு, ‘புதிய ஏற்பாட்டை’ எழுதிய ஒரு புரட்சியாளன்!
இது ஒரு கண்டிப்பான வாத்தியார் முறை போன்றது. கணினிக்குச் சொந்தமாகச் சிந்திக்கும் திறன் கிடையாது.
உ-ம்: இணையதள வரி (Tax) கணக்கீடு.
இங்குதான் மாயாஜாலம்! சமன்பாடு அப்படியே தலைகீழாக மாறுகிறது.
விதியை (Rule) கணினியே கண்டுபிடிக்கிறது! உ-ம்: பூனையை அடையாளம் காணுதல்.
பழைய முறைச் சிக்கல்: "பரிசு" என்று வந்தால் குப்பையில் போடு என விதி எழுதினால், மோசடிக்காரன் "ப.ரி.சு" என்று மாற்றி ஏமாற்றுவான்.
மெஷின் லேர்னிங்கின் மேஜிக் (Pattern Recognition):
இதை வைத்து, “இது ஸ்பேம்!” என்ற புதிய விதியை அதுவே உருவாக்கும்.
ஆசான் வழி கற்கும் முறை (Labelled Data).
சுயமாகக் கண்டறியும் முறை (Unlabeled Data).
முயற்சி மற்றும் பிழையிலிருந்து கற்கும் முறை (Trial & Error).
இங்கே கணினிக்குத் தரவுகள் மட்டும் வழங்கப்படுவதில்லை; கூடவே அதற்கான சரியான விடைகளும் (Labels) கையில் கொடுக்கப்படுகின்றன.
தொழில்நுட்பக் குறிப்பு:
குப்பையான உள்ளீடு = குப்பையான வெளியீடு (Garbage In, Garbage Out). நீங்கள் கொடுக்கும் லேபிள்கள் தவறென்றால், பதிலும் தவறே!
Supervised Learning திட்டத்தின் மிகப்பெரிய சவால் அல்காரிதம்களோ கணினிகளோ அல்ல. அது ‘தரவு லேபிளிங்’ (Data Labeling) என்ற மனித வேலைதான்!
உ-ம்: ஓட்டுநர் இல்லா கார்கள் (Self-Driving Cars)
லட்சக்கணக்கான வீடியோக்களில் தோன்றும் ஒவ்வொரு மனிதர், சிக்னல் மீதும் மனிதர்கள் உட்கார்ந்து கையால் கட்டம் போட்டு (Bounding Box), "இது மனிதர்" என்று லேபிளிட வேண்டும்.
Amazon Mechanical Turk போன்ற தளங்கள் மூலம் ஆயிரக்கணக்கான மனிதர்கள் திரைக்குப் பின்னால் உழைக்கிறார்கள்.
கணினிக்கு லேபிள்கள் இல்லாத, வகைப்படுத்தப்படாத மூலத் தரவுகள் (Raw, Unlabeled Data) மட்டுமே கொடுக்கப்படும். விடை சொல்லிக் கொடுக்கப்படாது.
வாங்கிய பொருட்கள், வாங்கும் அதிர்வெண், செலவழித்த தொகை போன்ற லேபிளிடப்படாத தரவுகள்.
AI எப்படி வேலை செய்கிறது? (Clustering):
அடையாளம்: அடிக்கடி வருபவர்கள், அள்ளிச் செலவழிப்பவர்கள்.
உத்தி: தள்ளுபடி வேண்டாம்; அங்கீகாரமும், பிரத்யேக உறவு மேலாளரும் (VIP Status) கொடுங்கள்.
அடையாளம்: சலுகை இருந்தால் மட்டுமே வருவார்கள்.
உத்தி: VIP சலுகை வீண். "இன்று மட்டும் 50% ஆஃபர்" போன்ற ஃப்ளாஷ் விற்பனை அறிவிப்புகளை அனுப்புங்கள்.
அடையாளம்: முதல் முறையாக வாங்கியவர்கள்.
உத்தி: அன்பான வரவேற்புத் தள்ளுபடியும், லாயல்டி திட்டமும் வழங்கி விசுவாசமாக மாற்றுங்கள்.
இயந்திரம் ஒரு செயலி (Agent) ஆகச் செயல்படுகிறது. ஒரு குழந்தை சூடான அடுப்பைத் தொட்டு வலிப்பதன் மூலம் கற்பது போல, தவறுகளிலிருந்து கற்கிறது.
உ-ம்: ரோபோ டாக்ஸி (Robot Taxi)
2016-ல், உலக சாம்பியன் லீ செடாலுடன் நடந்த 'கோ' (Go) விளையாட்டில், கூகிளின் AlphaGo தனது 37-வது நகர்வைச் செய்தது. மனித வரலாற்றில் யாரும் பார்த்திராத விசித்திரமான நகர்வு அது.
அனைத்து மனித நிபுணர்களும் அதை ஒரு மாபெரும் பிழை என்று கருதினர். ஆனால், அந்த ஒற்றை நகர்வுதான் ஆட்டத்தின் போக்கையே மாற்றி AlphaGo-வுக்கு வெற்றியைத் தேடித்தந்தது. இயந்திரங்கள் மனித அறிவுக்கு அப்பாற்பட்ட புதிய, ஆக்கப்பூர்வமான அறிவை உருவாக்க முடியும் என உலகம் உணர்ந்த தருணம்!
செய்யறிவுப் புரட்சியின் உண்மையான பொறி (Engine). பல அடுக்குகளைக் கொண்ட செய்நரவலைகளால் (Artificial Neural Networks) மனித மூளையைப் போலவே ஆழமாகச் சிந்திப்பது.
ஏன் இது "ஆழமானது"? ஆழம் என்பது செயலாக்க அடுக்குகளின் (Layers) எண்ணிக்கையைக் குறிக்கிறது. ஒரு சிக்கலான விஷயத்தைப் படிப்படியாகப் பிரித்துப் புரிந்துகொள்ளுதல்.
படத்தின் அடிப்படை அம்சங்களான கோடுகள், விளிம்புகள், வண்ணப் புள்ளிகளைக் கற்றுக்கொள்கிறது.
கோடுகளை இணைத்து கண்கள், காதுகள், மூக்கு போன்ற சற்று சிக்கலான வடிவங்களை உணர்கிறது.
அனைத்தையும் இணைத்து, இது ஒரு 'பூனை' என்ற முழுமையான கருத்தைப் புரிந்துகொள்கிறது.
ஞாயிற்றுக்கிழமை மாலை. களைப்பைத் தணிக்கக் கடற்கரை சென்று காற்று வாங்க முடிவு செய்கிறீர்கள் என்று வைத்துக்கொள்வோம். இதைத் தீர்மானிக்க உங்கள் மூளை முக்கியமாகப் பின்வரும் மூன்று காரணிகளை அலசுகிறது:
வெளியே நல்ல வானிலையா, அல்லது மழையா?
x₁ = 1 (நல்ல வானிலை)
x₁ = 0 (மழை)
உங்கள் நண்பனோ தோழியோ உங்களுடன் வர விரும்புகிறாரா?
x₂ = 1 (வருவார்)
x₂ = 0 (வரமாட்டார்)
பொதுப் போக்குவரத்து (பஸ்/ரயில்) அருகில் கிடைக்கிறதா?
x₃ = 1 (கிடைக்கும்)
x₃ = 0 (கிடைக்காது)
இந்த மூன்று காரணிகளையும் நமது பெர்செப்ட்ரானுக்கு x₁, x₂, x₃ ஆகிய பைனரி (0 அல்லது 1) மாறிகள் மூலம் உள்ளீடாகக் கொடுக்கலாம்.
உங்கள் முன்னுரிமைகளுக்கு ஏற்ப எடைகளை (Weights) நிர்ணயிப்போம். வானிலை மிக முக்கியம் என்று வைத்துக்கொள்வோம்:
w₁ = 6 → வானிலை
w₂ = 2 → நண்பன்
w₃ = 2 → போக்குவரத்து
Threshold = 5
∑ = (w₁×x₁) + (w₂×x₂) + (w₃×x₃)
∑ ≥ 5 → 1 (செல்லலாம்)
∑ < 5 → 0 (வேண்டாம்)
இரண்டு வேறுபட்ட சூழல்களை எடுத்துக்கொண்டு, நமது பெர்செப்ட்ரான் எப்படி முடிவெடுக்கிறது என்று பார்ப்போம்:
x₁ = 1 (நல்ல வானிலை)
x₂ = 0 (நண்பன் இல்லை)
x₃ = 0 (போக்குவரத்து இல்லை)
∑ = (6×1) + (2×0) + (2×0) = 6
6 > 5 → வெளியீடு: 1
✓ கடற்கரைக்குச் செல்லலாம்!
x₁ = 0 (மழை)
x₂ = 1 (நண்பன் வருவார்)
x₃ = 1 (போக்குவரத்து உண்டு)
∑ = (6×0) + (2×1) + (2×1) = 4
4 < 5 → வெளியீடு: 0
✗ வீட்டிலேயே இருங்கள்!
முக்கிய புரிதல்: எடைகள் (Weights) மற்றும் மதகு அளவை (Threshold) மாற்றுவதன் மூலம், ஒரு இயந்திரத்தின் ஒட்டுமொத்த முடிவெடுக்கும் குணாதிசயத்தையே நம்மால் மாற்றிவிட முடியும்!
"ஆழக் கற்றலின் கண்கள்"
படங்கள், காணொளிகள் போன்ற காட்சித் தரவுகளைப் பகுப்பாய்வு செய்வதில் நிபுணத்துவம் பெற்றவை.
பயன்பாடு: முக அங்கீகாரம் (Face ID), மருத்துவ ஸ்கேன் (MRI), கார்களில் சாலையைக் கண்டறிதல்.
"ஆழக் கற்றலின் காதுகளும் வாயும்"
மொழி, பேச்சு, பங்குச் சந்தை போன்ற தொடர்ச்சியான (Sequential) தரவுகளைக் கையாள்வதில் சிறந்தவை.
பயன்பாடு: குரல் உதவியாளர்கள் (Siri), தானியங்கி மொழிபெயர்ப்பு, Chatbots.
நரம்பியல் வலைப்பின்னல்கள் என்ற ஐடியா பல ஆண்டுகளாக இருந்தாலும், அதைப் பயிற்றுவிக்கச் சமீபத்திய 3 முன்னேற்றங்களே உதவின:
பிழைத் தகவல் (Gradient) கடைசி அடுக்கிலிருந்து முதல் அடுக்குக்குப் பின்னோக்கிச் செல்லும்போது (Backprop), அதன் மதிப்பு மெல்ல மெல்லக் குறைந்து முதல் அடுக்கில் 'சுழியமாக' மறைந்துவிடுகிறது (Vanish).
நீண்ட வரிசையில் நிற்கும் நபர்களிடம் ஒரு ரகசியத்தைச் சொல்லும்போது, அது முதல் நபரைச் சென்றடையும் முன் சிதைந்து போவதைப் போல!
இதனால்தான் பல ஆண்டுகளாக ஆழமான வலைப்பின்னல்களைப் பயிற்றுவிக்க முடியவில்லை. இன்று ReLU, LSTM போன்ற நுட்பங்கள் இதைத் தீர்த்துள்ளன.
பகுத்தறியும் AI (Discriminative - "இது பூனையா?") vs உருவாக்கும் AI (Generative - "புதிய பூனையை உருவாக்கு!"). படைப்பாற்றலின் புதிய சகாப்தம்.
2014-ல் இயன் குட்ஃபெலோ அறிமுகப்படுத்திய கணினிகளின் “கற்பனைத் திறன்”. இதன் அடிப்படை இரண்டு AI-களுக்கிடையேயான போட்டி!
முதல் முயற்சி: கலைஞன் களிம்பு போல ஒன்றை வரைகிறான். விமர்சகன் "இது போலி" என நிராகரிக்கிறான்.
ஆயிரக்கணக்கான முயற்சிகள்: கலைஞன் பாடம் கற்றுக்கொண்டு பாட்டில் வடிவத்திற்கு முன்னேறுகிறான். ஒரு கட்டத்தில் விமர்சகனாலேயே உண்மையா, பொய்யா எனப் பிரிக்க முடிவதில்லை!
இதுவே இன்று நாம் காணும் ChatGPT, Gemini போன்ற உரையாடல் AI-களின் அடித்தளம்.
வெளிப்படும் திறன்கள் (Emergent Abilities)
GPT-3 போன்ற மாதிரிகளில் 175 பில்லியன் அளவுருக்கள் (Parameters / Dials) உள்ளன. தரவுகளின் அளவு ஒரு எல்லையைத் தாண்டும்போது, வெறும் வார்த்தைகளைக் கணித்துக்கொண்டிருந்த இயந்திரம், மலையளவு தரவுகளுக்குள் ஒளிந்திருக்கும் தர்க்கங்களைத் தன்னிச்சையாகப் புரிந்துகொள்கிறது.
"மழை பெய்ததால், ____"
சாதாரண மாதிரி: "தெருக்கள் நனைந்தன" (எளிய கணிப்பு)
மேம்பட்ட LLM: "குழந்தைகள் காகிதங்களுடன் வெளியே ஓடினர்; ஓடைகள் சலசலத்தன" (சூழலைப் புரிந்த கற்பனை)
நாம் இதுவரை கண்ட இயந்திரக் கற்றல், ஆழக் கற்றல், மற்றும் உருவாக்கும் AI ஆகியவை ஒரு குறிப்பிட்ட களத்தில் தங்களின் முழுத் திறனையும் வெளிப்படுத்தும் மாயாஜாலக் களம்தான் மனித மொழி! அடுத்த அத்தியாயத்தில் மொழியின் புதிரையும் NLP-யின் அடிப்படைகளையும் ஆழமாக ஆராய்வோம்.