மூன்றாவது பொம்மை:
டீப் லேர்னிங் (Deep Learning)

செய்யறிவுப் புரட்சியின் உண்மையான பொறி (Engine). பல அடுக்குகளைக் கொண்ட செய்நரவலைகளால் (Artificial Neural Networks) மனித மூளையைப் போலவே ஆழமாகச் சிந்திப்பது.

Interactive Python Examples · Live Code Execution

16. படிநிலைக் கற்றல் (Hierarchical Learning)

ஏன் இது "ஆழமானது"? ஆழம் என்பது செயலாக்க அடுக்குகளின் (Layers) எண்ணிக்கையைக் குறிக்கிறது. ஒரு சிக்கலான விஷயத்தைப் படிப்படியாகப் பிரித்துப் புரிந்துகொள்ளுதல்.

அடுக்கு 1 (கீழ்மட்டம்)

படத்தின் அடிப்படை அம்சங்களான கோடுகள், விளிம்புகள், வண்ணப் புள்ளிகளைக் கற்றுக்கொள்கிறது.

அடுக்கு 2 (இடைப்பட்ட நிலை)

கோடுகளை இணைத்து கண்கள், காதுகள், மூக்கு போன்ற சற்று சிக்கலான வடிவங்களை உணர்கிறது.

அடுக்கு 3 (மேல்மட்டம்)

அனைத்தையும் இணைத்து, இது ஒரு 'பூனை' என்ற முழுமையான கருத்தைப் புரிந்துகொள்கிறது.

16a. பெர்செப்ட்ரான்: கடற்கரை முடிவு

ஞாயிற்றுக்கிழமை மாலை. களைப்பைத் தணிக்கக் கடற்கரை சென்று காற்று வாங்க முடிவு செய்கிறீர்கள் என்று வைத்துக்கொள்வோம். இதைத் தீர்மானிக்க உங்கள் மூளை முக்கியமாகப் பின்வரும் மூன்று காரணிகளை அலசுகிறது:

வானிலை (x₁)

வெளியே நல்ல வானிலையா, அல்லது மழையா?

x₁ = 1 (நல்ல வானிலை)
x₁ = 0 (மழை)

நண்பன் (x₂)

உங்கள் நண்பனோ தோழியோ உங்களுடன் வர விரும்புகிறாரா?

x₂ = 1 (வருவார்)
x₂ = 0 (வரமாட்டார்)

போக்குவரத்து (x₃)

பொதுப் போக்குவரத்து (பஸ்/ரயில்) அருகில் கிடைக்கிறதா?

x₃ = 1 (கிடைக்கும்)
x₃ = 0 (கிடைக்காது)

இந்த மூன்று காரணிகளையும் நமது பெர்செப்ட்ரானுக்கு x₁, x₂, x₃ ஆகிய பைனரி (0 அல்லது 1) மாறிகள் மூலம் உள்ளீடாகக் கொடுக்கலாம்.

16b. எடைகளின் மாயாஜாலம்

உங்கள் முன்னுரிமைகளுக்கு ஏற்ப எடைகளை (Weights) நிர்ணயிப்போம். வானிலை மிக முக்கியம் என்று வைத்துக்கொள்வோம்:

எடைகள் & மதகு

w₁ = 6 → வானிலை
w₂ = 2 → நண்பன்
w₃ = 2 → போக்குவரத்து
Threshold = 5

முடிவு எடுக்கும் முறை

∑ = (w₁×x₁) + (w₂×x₂) + (w₃×x₃)

∑ ≥ 5 → 1 (செல்லலாம்)
∑ < 5 → 0 (வேண்டாம்)

16c. பெர்செப்ட்ரான் செயல்பாட்டில்

இரண்டு வேறுபட்ட சூழல்களை எடுத்துக்கொண்டு, நமது பெர்செப்ட்ரான் எப்படி முடிவெடுக்கிறது என்று பார்ப்போம்:

சூழல் 1: நல்ல வானிலை ☀️

x₁ = 1 (நல்ல வானிலை)
x₂ = 0 (நண்பன் இல்லை)
x₃ = 0 (போக்குவரத்து இல்லை)

∑ = (6×1) + (2×0) + (2×0) = 6

6 > 5 → வெளியீடு: 1

✓ கடற்கரைக்குச் செல்லலாம்!

சூழல் 2: கனமழை 🌧️

x₁ = 0 (மழை)
x₂ = 1 (நண்பன் வருவார்)
x₃ = 1 (போக்குவரத்து உண்டு)

∑ = (6×0) + (2×1) + (2×1) = 4

4 < 5 → வெளியீடு: 0

✗ வீட்டிலேயே இருங்கள்!

முக்கிய புரிதல்: எடைகள் (Weights) மற்றும் மதகு அளவை (Threshold) மாற்றுவதன் மூலம், ஒரு இயந்திரத்தின் ஒட்டுமொத்த முடிவெடுக்கும் குணாதிசயத்தையே நம்மால் மாற்றிவிட முடியும்!

17. ஆழக் கற்றலின் முக்கியக் கட்டமைப்புகள்

CNN (சுருள் செய்நரவலை)

"ஆழக் கற்றலின் கண்கள்"

படங்கள், காணொளிகள் போன்ற காட்சித் தரவுகளைப் பகுப்பாய்வு செய்வதில் நிபுணத்துவம் பெற்றவை.

பயன்பாடு: முக அங்கீகாரம் (Face ID), மருத்துவ ஸ்கேன் (MRI), கார்களில் சாலையைக் கண்டறிதல்.

RNN (தொடர் செய்நரவலை)

"ஆழக் கற்றலின் காதுகளும் வாயும்"

மொழி, பேச்சு, பங்குச் சந்தை போன்ற தொடர்ச்சியான (Sequential) தரவுகளைக் கையாள்வதில் சிறந்தவை.

பயன்பாடு: குரல் உதவியாளர்கள் (Siri), தானியங்கி மொழிபெயர்ப்பு, Chatbots.

18. புரட்சிக்கு வித்திட்ட மூன்று தூண்கள்

நரம்பியல் வலைப்பின்னல்கள் என்ற ஐடியா பல ஆண்டுகளாக இருந்தாலும், அதைப் பயிற்றுவிக்கச் சமீபத்திய 3 முன்னேற்றங்களே உதவின:

  • பெருந்தரவுகள் (Big Data): ImageNet போன்ற கோடிக்கணக்கான லேபிளிடப்பட்ட படங்களின் தரவுத்தளங்கள் மாபெரும் உணவாக அமைந்தன.
  • சக்திவாய்ந்த வன்பொருள் (GPUs): வீடியோ கேம்களுக்காக உருவாக்கப்பட்ட GPU-க்கள் ஒரே நேரத்தில் ஆயிரக்கணக்கான கணக்குகளைச் செய்து பயிற்சி நேரத்தைக் குறைத்தன.
  • மேம்பட்ட அல்காரிதம்கள் (Algorithms): Backpropagation போன்ற நுட்பங்களில் ஏற்பட்ட முன்னேற்றங்கள் ஆழமான வலைப்பின்னல்களைப் பயிற்றுவிக்க வழிவகுத்தன.

19. Vanishing Gradient Problem

Whisper Down the Lane

பிழைத் தகவல் (Gradient) கடைசி அடுக்கிலிருந்து முதல் அடுக்குக்குப் பின்னோக்கிச் செல்லும்போது (Backprop), அதன் மதிப்பு மெல்ல மெல்லக் குறைந்து முதல் அடுக்கில் 'சுழியமாக' மறைந்துவிடுகிறது (Vanish).

நீண்ட வரிசையில் நிற்கும் நபர்களிடம் ஒரு ரகசியத்தைச் சொல்லும்போது, அது முதல் நபரைச் சென்றடையும் முன் சிதைந்து போவதைப் போல!

இதனால்தான் பல ஆண்டுகளாக ஆழமான வலைப்பின்னல்களைப் பயிற்றுவிக்க முடியவில்லை. இன்று ReLU, LSTM போன்ற நுட்பங்கள் இதைத் தீர்த்துள்ளன.

Backpropagation and Vanishing Gradient

நான்காவது (மையப்) பொம்மை:
ஜெனரேட்டிவ் AI (Generative AI)

பகுத்தறியும் AI (Discriminative - "இது பூனையா?") vs உருவாக்கும் AI (Generative - "புதிய பூனையை உருவாக்கு!"). படைப்பாற்றலின் புதிய சகாப்தம்.

Artist painting in gallery

20. GANs: கலைஞனும் விமர்சகனும்

Generative Adversarial Networks (GANs)

2014-ல் இயன் குட்ஃபெலோ அறிமுகப்படுத்திய கணினிகளின் “கற்பனைத் திறன்”. இதன் அடிப்படை இரண்டு AI-களுக்கிடையேயான போட்டி!

  • ஜெனரேட்டர் (கலைஞன்): இதன் வேலை, உண்மையான படைப்புகளைப் போலவே, புதிய போலிப் படைப்புகளை உருவாக்குவது.
  • டிஸ்கிரிமினேட்டர் (விமர்சகன்): இதன் வேலை, உண்மையான படைப்பையும், போலிப் படைப்பையும் ஒப்பிட்டு, எது போலி என்பதைக் கண்டுபிடிப்பது.
GAN Learning Cycle

21. GAN-களின் கற்றல் சுற்று & சவால்கள்

கெட்சப் பாட்டில் பயிற்சி

முதல் முயற்சி: கலைஞன் களிம்பு போல ஒன்றை வரைகிறான். விமர்சகன் "இது போலி" என நிராகரிக்கிறான்.

ஆயிரக்கணக்கான முயற்சிகள்: கலைஞன் பாடம் கற்றுக்கொண்டு பாட்டில் வடிவத்திற்கு முன்னேறுகிறான். ஒரு கட்டத்தில் விமர்சகனாலேயே உண்மையா, பொய்யா எனப் பிரிக்க முடிவதில்லை!

படைப்பாற்றலின் இருமுனைக் கத்தி

  • Deepfakes: போலியான செய்தி வீடியோக்களை உருவாக்கிச் சமூகத்தில் குழப்பம் ஏற்படுத்துதல்.
  • Mode Collapse: கலைஞன் ஒரே ஒரு உத்தியை மட்டும் கற்றுக்கொண்டு, அதையே திரும்பத் திரும்ப உருவாக்குதல்.
Next Token Prediction

22. டிரான்ஸ்ஃபார்மர்கள் மற்றும் LLM-கள்

இதுவே இன்று நாம் காணும் ChatGPT, Gemini போன்ற உரையாடல் AI-களின் அடித்தளம்.

  • அடுத்த வார்த்தையைக் கணிப்பது (Next-Token Prediction): இணையப் பக்கங்களைப் படித்து, புள்ளியியல் ரீதியாக அடுத்த வார்த்தையை ஊகிப்பது.
  • கவனத்தின் சக்தி (Attention Mechanism): நீண்ட வாக்கியத்தில் எந்த வார்த்தைகளுக்கு அதிக முக்கியத்துவம் கொடுக்க வேண்டும் என்பதைத் தீர்மானிக்கிறது.
    உ-ம்: "மலைகளின் ராணியான ஊட்டி, மிகவும் குளிர்ச்சியாக இருந்தது" - குளிர்ச்சியாக என்பதை ஊட்டியோடு இணைத்துப் புரிதல்.

23. அளவின் அற்புதம் (The Miracle of Scale)

வெளிப்படும் திறன்கள் (Emergent Abilities)

GPT-3 போன்ற மாதிரிகளில் 175 பில்லியன் அளவுருக்கள் (Parameters / Dials) உள்ளன. தரவுகளின் அளவு ஒரு எல்லையைத் தாண்டும்போது, வெறும் வார்த்தைகளைக் கணித்துக்கொண்டிருந்த இயந்திரம், மலையளவு தரவுகளுக்குள் ஒளிந்திருக்கும் தர்க்கங்களைத் தன்னிச்சையாகப் புரிந்துகொள்கிறது.

"மழை பெய்ததால், ____"

சாதாரண மாதிரி: "தெருக்கள் நனைந்தன" (எளிய கணிப்பு)

மேம்பட்ட LLM: "குழந்தைகள் காகிதங்களுடன் வெளியே ஓடினர்; ஓடைகள் சலசலத்தன" (சூழலைப் புரிந்த கற்பனை)

அடுத்த படி: இயல் மொழி செயலாக்கம் (NLP)

நாம் இதுவரை கண்ட இயந்திரக் கற்றல், ஆழக் கற்றல், மற்றும் உருவாக்கும் AI ஆகியவை ஒரு குறிப்பிட்ட களத்தில் தங்களின் முழுத் திறனையும் வெளிப்படுத்தும் மாயாஜாலக் களம்தான் மனித மொழி! அடுத்த அத்தியாயத்தில் மொழியின் புதிரையும் NLP-யின் அடிப்படைகளையும் ஆழமாக ஆராய்வோம்.

1 / 14