செய்யறிவுப் புரட்சியின் உண்மையான பொறி (Engine). பல அடுக்குகளைக் கொண்ட செய்நரவலைகளால் (Artificial Neural Networks) மனித மூளையைப் போலவே ஆழமாகச் சிந்திப்பது.
Interactive Python Examples · Live Code Execution
ஏன் இது "ஆழமானது"? ஆழம் என்பது செயலாக்க அடுக்குகளின் (Layers) எண்ணிக்கையைக் குறிக்கிறது. ஒரு சிக்கலான விஷயத்தைப் படிப்படியாகப் பிரித்துப் புரிந்துகொள்ளுதல்.
படத்தின் அடிப்படை அம்சங்களான கோடுகள், விளிம்புகள், வண்ணப் புள்ளிகளைக் கற்றுக்கொள்கிறது.
கோடுகளை இணைத்து கண்கள், காதுகள், மூக்கு போன்ற சற்று சிக்கலான வடிவங்களை உணர்கிறது.
அனைத்தையும் இணைத்து, இது ஒரு 'பூனை' என்ற முழுமையான கருத்தைப் புரிந்துகொள்கிறது.
ஞாயிற்றுக்கிழமை மாலை. களைப்பைத் தணிக்கக் கடற்கரை சென்று காற்று வாங்க முடிவு செய்கிறீர்கள் என்று வைத்துக்கொள்வோம். இதைத் தீர்மானிக்க உங்கள் மூளை முக்கியமாகப் பின்வரும் மூன்று காரணிகளை அலசுகிறது:
வெளியே நல்ல வானிலையா, அல்லது மழையா?
x₁ = 1 (நல்ல வானிலை)
x₁ = 0 (மழை)
உங்கள் நண்பனோ தோழியோ உங்களுடன் வர விரும்புகிறாரா?
x₂ = 1 (வருவார்)
x₂ = 0 (வரமாட்டார்)
பொதுப் போக்குவரத்து (பஸ்/ரயில்) அருகில் கிடைக்கிறதா?
x₃ = 1 (கிடைக்கும்)
x₃ = 0 (கிடைக்காது)
இந்த மூன்று காரணிகளையும் நமது பெர்செப்ட்ரானுக்கு x₁, x₂, x₃ ஆகிய பைனரி (0 அல்லது 1) மாறிகள் மூலம் உள்ளீடாகக் கொடுக்கலாம்.
உங்கள் முன்னுரிமைகளுக்கு ஏற்ப எடைகளை (Weights) நிர்ணயிப்போம். வானிலை மிக முக்கியம் என்று வைத்துக்கொள்வோம்:
w₁ = 6 → வானிலை
w₂ = 2 → நண்பன்
w₃ = 2 → போக்குவரத்து
Threshold = 5
∑ = (w₁×x₁) + (w₂×x₂) + (w₃×x₃)
∑ ≥ 5 → 1 (செல்லலாம்)
∑ < 5 → 0 (வேண்டாம்)
இரண்டு வேறுபட்ட சூழல்களை எடுத்துக்கொண்டு, நமது பெர்செப்ட்ரான் எப்படி முடிவெடுக்கிறது என்று பார்ப்போம்:
x₁ = 1 (நல்ல வானிலை)
x₂ = 0 (நண்பன் இல்லை)
x₃ = 0 (போக்குவரத்து இல்லை)
∑ = (6×1) + (2×0) + (2×0) = 6
6 > 5 → வெளியீடு: 1
✓ கடற்கரைக்குச் செல்லலாம்!
x₁ = 0 (மழை)
x₂ = 1 (நண்பன் வருவார்)
x₃ = 1 (போக்குவரத்து உண்டு)
∑ = (6×0) + (2×1) + (2×1) = 4
4 < 5 → வெளியீடு: 0
✗ வீட்டிலேயே இருங்கள்!
முக்கிய புரிதல்: எடைகள் (Weights) மற்றும் மதகு அளவை (Threshold) மாற்றுவதன் மூலம், ஒரு இயந்திரத்தின் ஒட்டுமொத்த முடிவெடுக்கும் குணாதிசயத்தையே நம்மால் மாற்றிவிட முடியும்!
"ஆழக் கற்றலின் கண்கள்"
படங்கள், காணொளிகள் போன்ற காட்சித் தரவுகளைப் பகுப்பாய்வு செய்வதில் நிபுணத்துவம் பெற்றவை.
பயன்பாடு: முக அங்கீகாரம் (Face ID), மருத்துவ ஸ்கேன் (MRI), கார்களில் சாலையைக் கண்டறிதல்.
"ஆழக் கற்றலின் காதுகளும் வாயும்"
மொழி, பேச்சு, பங்குச் சந்தை போன்ற தொடர்ச்சியான (Sequential) தரவுகளைக் கையாள்வதில் சிறந்தவை.
பயன்பாடு: குரல் உதவியாளர்கள் (Siri), தானியங்கி மொழிபெயர்ப்பு, Chatbots.
நரம்பியல் வலைப்பின்னல்கள் என்ற ஐடியா பல ஆண்டுகளாக இருந்தாலும், அதைப் பயிற்றுவிக்கச் சமீபத்திய 3 முன்னேற்றங்களே உதவின:
பிழைத் தகவல் (Gradient) கடைசி அடுக்கிலிருந்து முதல் அடுக்குக்குப் பின்னோக்கிச் செல்லும்போது (Backprop), அதன் மதிப்பு மெல்ல மெல்லக் குறைந்து முதல் அடுக்கில் 'சுழியமாக' மறைந்துவிடுகிறது (Vanish).
நீண்ட வரிசையில் நிற்கும் நபர்களிடம் ஒரு ரகசியத்தைச் சொல்லும்போது, அது முதல் நபரைச் சென்றடையும் முன் சிதைந்து போவதைப் போல!
இதனால்தான் பல ஆண்டுகளாக ஆழமான வலைப்பின்னல்களைப் பயிற்றுவிக்க முடியவில்லை. இன்று ReLU, LSTM போன்ற நுட்பங்கள் இதைத் தீர்த்துள்ளன.
பகுத்தறியும் AI (Discriminative - "இது பூனையா?") vs உருவாக்கும் AI (Generative - "புதிய பூனையை உருவாக்கு!"). படைப்பாற்றலின் புதிய சகாப்தம்.
2014-ல் இயன் குட்ஃபெலோ அறிமுகப்படுத்திய கணினிகளின் “கற்பனைத் திறன்”. இதன் அடிப்படை இரண்டு AI-களுக்கிடையேயான போட்டி!
முதல் முயற்சி: கலைஞன் களிம்பு போல ஒன்றை வரைகிறான். விமர்சகன் "இது போலி" என நிராகரிக்கிறான்.
ஆயிரக்கணக்கான முயற்சிகள்: கலைஞன் பாடம் கற்றுக்கொண்டு பாட்டில் வடிவத்திற்கு முன்னேறுகிறான். ஒரு கட்டத்தில் விமர்சகனாலேயே உண்மையா, பொய்யா எனப் பிரிக்க முடிவதில்லை!
இதுவே இன்று நாம் காணும் ChatGPT, Gemini போன்ற உரையாடல் AI-களின் அடித்தளம்.
வெளிப்படும் திறன்கள் (Emergent Abilities)
GPT-3 போன்ற மாதிரிகளில் 175 பில்லியன் அளவுருக்கள் (Parameters / Dials) உள்ளன. தரவுகளின் அளவு ஒரு எல்லையைத் தாண்டும்போது, வெறும் வார்த்தைகளைக் கணித்துக்கொண்டிருந்த இயந்திரம், மலையளவு தரவுகளுக்குள் ஒளிந்திருக்கும் தர்க்கங்களைத் தன்னிச்சையாகப் புரிந்துகொள்கிறது.
"மழை பெய்ததால், ____"
சாதாரண மாதிரி: "தெருக்கள் நனைந்தன" (எளிய கணிப்பு)
மேம்பட்ட LLM: "குழந்தைகள் காகிதங்களுடன் வெளியே ஓடினர்; ஓடைகள் சலசலத்தன" (சூழலைப் புரிந்த கற்பனை)
நாம் இதுவரை கண்ட இயந்திரக் கற்றல், ஆழக் கற்றல், மற்றும் உருவாக்கும் AI ஆகியவை ஒரு குறிப்பிட்ட களத்தில் தங்களின் முழுத் திறனையும் வெளிப்படுத்தும் மாயாஜாலக் களம்தான் மனித மொழி! அடுத்த அத்தியாயத்தில் மொழியின் புதிரையும் NLP-யின் அடிப்படைகளையும் ஆழமாக ஆராய்வோம்.