அத்தியாயம் 2:
அறிவின் அடுக்குகள்

AI, Machine Learning, Deep Learning மற்றும் Generative AI-இன் மாயாஜால உலகம்

தொழில்நுட்பப் பொது விரிவுரை

1. அறிமுகம்: ஒரு மாபெரும் குழப்பம்

செய்யறிவு (AI) இன்று நமது வாழ்வின் ஒவ்வொரு இழையிலும் பின்னிப் பிணைந்துவிட்டது. ஆனால், மாயாஜாலத் திரைக்குப் பின்னால் ஒளிந்திருக்கும் உண்மை என்ன?

ஒரு பொதுவான குழப்பம்:

பெரும்பாலானோர் AI, Machine Learning, Deep Learning ஆகிய வார்த்தைகளை ஒரே அர்த்தத்தில் பயன்படுத்துகிறார்கள். ஆனால், அவை ஒவ்வொன்றும் வேறுபட்டவை; அதே சமயம் ஒன்றோடொன்று பிரிக்க முடியாதவை.

இந்தக் குழப்பத்தைத் தீர்க்க, ஒரு சிறந்த உவமையை நாம் துணைக்கு அழைப்போம்!

Russian Nesting Dolls Matryoshka

2. உவமை: ரஷ்யாவின் மரப் பொம்மைகள்

ஒன்றுக்குள் ஒன்றாகப் பொருத்தப்பட்டிருக்கும் ரஷ்யாவின் புகழ்பெற்ற மரப் பொம்மைகளை (Matryoshka dolls) கற்பனை செய்துபாருங்கள்.

  • பெரிய பொம்மை: செய்யறிவு (AI)
  • இரண்டாவது: மெஷின் லேர்னிங் (Machine Learning)
  • மூன்றாவது: டீப் லேர்னிங் (Deep Learning)
  • மையப் பொம்மை: ஜெனரேட்டிவ் AI (Generative AI)

இவை தனித்தனித் தீவுகள் அல்ல. ஒன்றுக்குள் ஒன்றாகப் பின்னிப் பிணைந்திருக்கும் அறிவின் அடுக்குகள்.

3. முதல் பொம்மை: செய்யறிவு (The Big Picture)

செய்யறிவு (AI): இதை ஒரு தனிப்பட்ட மென்பொருள் என்று நினைத்துவிடாதீர்கள். இது எல்லாவற்றையும் தனக்குள் அடக்கிய ஒரு ‘மாபெரும் குடை’ (Umbrella Term).

இதன் லட்சியம் என்ன?

மனிதனைப் போலவே சிந்திக்கவும், திட்டமிடவும், மொழியைப் புரிந்து கொள்ளவும், சில சமயங்களில் நம்மை விடச் சிறப்பாகச் செயல்படவும் கூடிய இயந்திரங்களை உருவாக்குவதே இதன் மாபெரும் தேடல்.

Artificial Intelligence Big Picture

4. இரண்டு வகை ஆட்டக்காரர்கள்

1. குறுகிய AI (Narrow AI)

“ஸ்பெஷலிஸ்ட்”

இன்று நாம் பயன்படுத்தும் அனைத்து AI-களும் இந்த வகையே.

  • ஒரு குறிப்பிட்ட வேலையைச் செய்வதில் கில்லாடிகள்.
  • சதுரங்க AI-யிடம் காபி கேட்டால் விழிக்கும்!
  • சுருக்கம்: ஒரே ஒரு வேலையை மனிதனை விடச் சிறப்பாகச் செய்யும் நிபுணன்.

2. பொது AI (General AI - AGI)

“ஆல் ரவுண்டர்”

இதுதான் AI ஆராய்ச்சியின் புனிதக் கிண்ணம் (Holy Grail).

  • மனிதனைப் போலவே எந்தவொரு புதிய செயலையும் கற்கும் திறன்.
  • காலையில் கணக்கு, மதியம் கவிதை, மாலையில் ஆலோசனை.
  • சுருக்கம்: பல துறைகளிலும் அறிவைப் பயன்படுத்தும் ‘சகலகலா வல்லவன்’.

5. AI-யின் இரண்டு பாதைகள் (எதிரிகள் அல்ல, கூட்டாளிகள்)

பள்ளி 1: குறியீட்டு AI (Symbolic AI) பள்ளி 2: மெஷின் லேர்னிங் (Machine Learning)
“கறார் வாத்தியார் முறை” “ஸ்மார்ட் மாணவன் முறை”
மனித அறிவை அப்படியே விதிகளாக (Rules) மாற்றி கணினிக்குப் புகட்டுதல். விதிகளைச் சொல்லிக் கொடுக்காமல் தரவுகளைக் (Data) கொடுத்துக் கற்க வைத்தல்.
IF நோயாளிக்கு காய்ச்சல் THEN பாராசிட்டமால் கொடு (Expert Systems). ஆயிரக்கணக்கான படங்களைக் காட்டி 'இது பூனை' எனக் கற்றுக் கொடுத்தல்.
தெளிவான கட்டமைப்பு & லாஜிக் வழங்குகிறது. நெகிழ்வுத்தன்மையையும், முடிவற்ற கற்கும் திறனையும் வழங்குகிறது.

6. கலை உலகில் AI: ஒரு விவாதம்

Théâtre d’Opéra Spatial

2022-ம் ஆண்டு, கொலராடோ கலைக் கண்காட்சியில் முதல் பரிசை வென்ற ஓவியத்தை வரைந்தது ஒரு மனிதர் அல்ல, Midjourney என்ற AI.

இது எழுப்பிய கேள்விகள்:

  • AI-ஆல் உருவாக்கப்பட்ட ஒரு படைப்பைக் ‘கலை’ என்று அழைக்கலாமா?
  • இதன் உண்மையான கலைஞர் யார்?
  • படைப்பாற்றல் என்பது மனிதனுக்கு மட்டுமே உரித்தான ஒன்றா?
Abstract Art representation

இரண்டாவது பொம்மை:
மெஷின் லேர்னிங் (Machine Learning)

இது சும்மா ஒரு தொழில்நுட்பம் அல்ல; கணினி வரலாற்றின் ‘பழைய ஏற்பாட்டை’ கிழித்து எறிந்துவிட்டு, ‘புதிய ஏற்பாட்டை’ எழுதிய ஒரு புரட்சியாளன்!

7. ரோபோ சமையல்காரன் vs புத்திசாலி மாணவன்

1. பழைய பள்ளி முறை (Traditional)

இது ஒரு கண்டிப்பான வாத்தியார் முறை போன்றது. கணினிக்குச் சொந்தமாகச் சிந்திக்கும் திறன் கிடையாது.

தரவு (Data) + விதிகள் (Rules) = பதில்கள் (Answers)

உ-ம்: இணையதள வரி (Tax) கணக்கீடு.

2. புதிய புரட்சி முறை (Machine Learning)

இங்குதான் மாயாஜாலம்! சமன்பாடு அப்படியே தலைகீழாக மாறுகிறது.

தரவு (Data) + பதில்கள் (Answers) = விதிகள் (Rules)

விதியை (Rule) கணினியே கண்டுபிடிக்கிறது! உ-ம்: பூனையை அடையாளம் காணுதல்.

Hacker / Spam representation

8. ஸ்பேம் ஃபில்டர்: ஒரு துப்பறியும் நிபுணர்

பழைய முறைச் சிக்கல்: "பரிசு" என்று வந்தால் குப்பையில் போடு என விதி எழுதினால், மோசடிக்காரன் "ப.ரி.சு" என்று மாற்றி ஏமாற்றுவான்.

மெஷின் லேர்னிங்கின் மேஜிக் (Pattern Recognition):

  • "இந்த நபர் இதுவரை உங்களுக்கு மெயில் அனுப்பியதே இல்லை."
  • "இந்த மெயில் நள்ளிரவு 2 மணிக்கு நைஜீரியாவிலிருந்து வந்துள்ளது."
  • "தலைப்பில் நிறைய டாலர் ($$$) குறிகள் உள்ளன."

இதை வைத்து, “இது ஸ்பேம்!” என்ற புதிய விதியை அதுவே உருவாக்கும்.

9. கற்றலின் மூன்று முக்கியப் பாதைகள்

1. Supervised Learning

ஆசான் வழி கற்கும் முறை (Labelled Data).

2. Unsupervised Learning

சுயமாகக் கண்டறியும் முறை (Unlabeled Data).

3. Reinforcement Learning

முயற்சி மற்றும் பிழையிலிருந்து கற்கும் முறை (Trial & Error).

10. ஆசான் வழி கற்கும் முறை (Supervised Learning)

இங்கே கணினிக்குத் தரவுகள் மட்டும் வழங்கப்படுவதில்லை; கூடவே அதற்கான சரியான விடைகளும் (Labels) கையில் கொடுக்கப்படுகின்றன.

வகுப்பறையில் என்ன நடக்கிறது?

  • பயிற்சி: 10,000 படங்களைக் காட்டி "இது பூனை", "இது நாய்" என லேபிளோடு கற்பித்தல்.
  • கற்றல்: நுட்பமான வடிவங்களை (காது, வாய்) அதுவே கிரகிக்கிறது.
  • பரீட்சை: புதிய படத்தைக் காட்டியதும், "95% அடையாளங்கள் நாயோடு பொருந்துகிறது" என வகைப்படுத்துகிறது (Classification).

தொழில்நுட்பக் குறிப்பு:

குப்பையான உள்ளீடு = குப்பையான வெளியீடு (Garbage In, Garbage Out). நீங்கள் கொடுக்கும் லேபிள்கள் தவறென்றால், பதிலும் தவறே!

11. நிதர்சன உண்மை: AI-யின் பின்னாலிருக்கும் மனித வியர்வை!

Supervised Learning திட்டத்தின் மிகப்பெரிய சவால் அல்காரிதம்களோ கணினிகளோ அல்ல. அது ‘தரவு லேபிளிங்’ (Data Labeling) என்ற மனித வேலைதான்!

உ-ம்: ஓட்டுநர் இல்லா கார்கள் (Self-Driving Cars)

லட்சக்கணக்கான வீடியோக்களில் தோன்றும் ஒவ்வொரு மனிதர், சிக்னல் மீதும் மனிதர்கள் உட்கார்ந்து கையால் கட்டம் போட்டு (Bounding Box), "இது மனிதர்" என்று லேபிளிட வேண்டும்.

Amazon Mechanical Turk போன்ற தளங்கள் மூலம் ஆயிரக்கணக்கான மனிதர்கள் திரைக்குப் பின்னால் உழைக்கிறார்கள்.

Data annotation concept

12. சுயமாகக் கண்டறியும் முறை (Unsupervised Learning)

கணினிக்கு லேபிள்கள் இல்லாத, வகைப்படுத்தப்படாத மூலத் தரவுகள் (Raw, Unlabeled Data) மட்டுமே கொடுக்கப்படும். விடை சொல்லிக் கொடுக்கப்படாது.

எடுத்துக்காட்டு: பல்பொருள் அங்காடி தரவு

வாங்கிய பொருட்கள், வாங்கும் அதிர்வெண், செலவழித்த தொகை போன்ற லேபிளிடப்படாத தரவுகள்.

AI எப்படி வேலை செய்கிறது? (Clustering):

  • தரவுக் கடலில் மூழ்கி, ஒத்த பண்புகள் கொண்ட வாடிக்கையாளர்களைத் தானாகவே குழுக்களாகப் பிரிக்கிறது (K-Means Clustering, RFM Analysis).

13. வணிக மேஜிக்: AI பிரித்துக் கொடுக்கும் 3 குழுக்கள்

1. VIP வாடிக்கையாளர்கள்

அடையாளம்: அடிக்கடி வருபவர்கள், அள்ளிச் செலவழிப்பவர்கள்.

உத்தி: தள்ளுபடி வேண்டாம்; அங்கீகாரமும், பிரத்யேக உறவு மேலாளரும் (VIP Status) கொடுங்கள்.

2. தள்ளுபடித் தென்றல்கள்

அடையாளம்: சலுகை இருந்தால் மட்டுமே வருவார்கள்.

உத்தி: VIP சலுகை வீண். "இன்று மட்டும் 50% ஆஃபர்" போன்ற ஃப்ளாஷ் விற்பனை அறிவிப்புகளை அனுப்புங்கள்.

3. புதிய மொட்டுகள்

அடையாளம்: முதல் முறையாக வாங்கியவர்கள்.

உத்தி: அன்பான வரவேற்புத் தள்ளுபடியும், லாயல்டி திட்டமும் வழங்கி விசுவாசமாக மாற்றுங்கள்.

Self driving autonomous car

14. முயற்சி மற்றும் பிழையிலிருந்து கற்றல் (Reinforcement)

இயந்திரம் ஒரு செயலி (Agent) ஆகச் செயல்படுகிறது. ஒரு குழந்தை சூடான அடுப்பைத் தொட்டு வலிப்பதன் மூலம் கற்பது போல, தவறுகளிலிருந்து கற்கிறது.

உ-ம்: ரோபோ டாக்ஸி (Robot Taxi)

  • பயணியைப் பாதுகாப்பாக இறக்கினால் = வெகுமதி (Reward).
  • சிகப்பு விளக்கை மீறினால் = தண்டனை (Penalty).
  • நீண்ட காலத்தில் மொத்த வெகுமதிகளை அதிகப்படுத்தும் விதிகளை அதுவே கற்றுக்கொள்கிறது.

15. ஒரு வரலாற்றுத் தருணம்:
AlphaGo-வின் “நகர்வு 37”

2016-ல், உலக சாம்பியன் லீ செடாலுடன் நடந்த 'கோ' (Go) விளையாட்டில், கூகிளின் AlphaGo தனது 37-வது நகர்வைச் செய்தது. மனித வரலாற்றில் யாரும் பார்த்திராத விசித்திரமான நகர்வு அது.

அனைத்து மனித நிபுணர்களும் அதை ஒரு மாபெரும் பிழை என்று கருதினர். ஆனால், அந்த ஒற்றை நகர்வுதான் ஆட்டத்தின் போக்கையே மாற்றி AlphaGo-வுக்கு வெற்றியைத் தேடித்தந்தது. இயந்திரங்கள் மனித அறிவுக்கு அப்பாற்பட்ட புதிய, ஆக்கப்பூர்வமான அறிவை உருவாக்க முடியும் என உலகம் உணர்ந்த தருணம்!

மூன்றாவது பொம்மை:
டீப் லேர்னிங் (Deep Learning)

செய்யறிவுப் புரட்சியின் உண்மையான பொறி (Engine). பல அடுக்குகளைக் கொண்ட செய்நரவலைகளால் (Artificial Neural Networks) மனித மூளையைப் போலவே ஆழமாகச் சிந்திப்பது.

16. படிநிலைக் கற்றல் (Hierarchical Learning)

ஏன் இது "ஆழமானது"? ஆழம் என்பது செயலாக்க அடுக்குகளின் (Layers) எண்ணிக்கையைக் குறிக்கிறது. ஒரு சிக்கலான விஷயத்தைப் படிப்படியாகப் பிரித்துப் புரிந்துகொள்ளுதல்.

அடுக்கு 1 (கீழ்மட்டம்)

படத்தின் அடிப்படை அம்சங்களான கோடுகள், விளிம்புகள், வண்ணப் புள்ளிகளைக் கற்றுக்கொள்கிறது.

அடுக்கு 2 (இடைப்பட்ட நிலை)

கோடுகளை இணைத்து கண்கள், காதுகள், மூக்கு போன்ற சற்று சிக்கலான வடிவங்களை உணர்கிறது.

அடுக்கு 3 (மேல்மட்டம்)

அனைத்தையும் இணைத்து, இது ஒரு 'பூனை' என்ற முழுமையான கருத்தைப் புரிந்துகொள்கிறது.

16a. பெர்செப்ட்ரான்: கடற்கரை முடிவு

ஞாயிற்றுக்கிழமை மாலை. களைப்பைத் தணிக்கக் கடற்கரை சென்று காற்று வாங்க முடிவு செய்கிறீர்கள் என்று வைத்துக்கொள்வோம். இதைத் தீர்மானிக்க உங்கள் மூளை முக்கியமாகப் பின்வரும் மூன்று காரணிகளை அலசுகிறது:

வானிலை (x₁)

வெளியே நல்ல வானிலையா, அல்லது மழையா?

x₁ = 1 (நல்ல வானிலை)
x₁ = 0 (மழை)

நண்பன் (x₂)

உங்கள் நண்பனோ தோழியோ உங்களுடன் வர விரும்புகிறாரா?

x₂ = 1 (வருவார்)
x₂ = 0 (வரமாட்டார்)

போக்குவரத்து (x₃)

பொதுப் போக்குவரத்து (பஸ்/ரயில்) அருகில் கிடைக்கிறதா?

x₃ = 1 (கிடைக்கும்)
x₃ = 0 (கிடைக்காது)

இந்த மூன்று காரணிகளையும் நமது பெர்செப்ட்ரானுக்கு x₁, x₂, x₃ ஆகிய பைனரி (0 அல்லது 1) மாறிகள் மூலம் உள்ளீடாகக் கொடுக்கலாம்.

16b. எடைகளின் மாயாஜாலம்

உங்கள் முன்னுரிமைகளுக்கு ஏற்ப எடைகளை (Weights) நிர்ணயிப்போம். வானிலை மிக முக்கியம் என்று வைத்துக்கொள்வோம்:

எடைகள் & மதகு

w₁ = 6 → வானிலை
w₂ = 2 → நண்பன்
w₃ = 2 → போக்குவரத்து
Threshold = 5

முடிவு எடுக்கும் முறை

∑ = (w₁×x₁) + (w₂×x₂) + (w₃×x₃)

∑ ≥ 5 → 1 (செல்லலாம்)
∑ < 5 → 0 (வேண்டாம்)

16c. பெர்செப்ட்ரான் செயல்பாட்டில்

இரண்டு வேறுபட்ட சூழல்களை எடுத்துக்கொண்டு, நமது பெர்செப்ட்ரான் எப்படி முடிவெடுக்கிறது என்று பார்ப்போம்:

சூழல் 1: நல்ல வானிலை ☀️

x₁ = 1 (நல்ல வானிலை)
x₂ = 0 (நண்பன் இல்லை)
x₃ = 0 (போக்குவரத்து இல்லை)

∑ = (6×1) + (2×0) + (2×0) = 6

6 > 5 → வெளியீடு: 1

✓ கடற்கரைக்குச் செல்லலாம்!

சூழல் 2: கனமழை 🌧️

x₁ = 0 (மழை)
x₂ = 1 (நண்பன் வருவார்)
x₃ = 1 (போக்குவரத்து உண்டு)

∑ = (6×0) + (2×1) + (2×1) = 4

4 < 5 → வெளியீடு: 0

✗ வீட்டிலேயே இருங்கள்!

முக்கிய புரிதல்: எடைகள் (Weights) மற்றும் மதகு அளவை (Threshold) மாற்றுவதன் மூலம், ஒரு இயந்திரத்தின் ஒட்டுமொத்த முடிவெடுக்கும் குணாதிசயத்தையே நம்மால் மாற்றிவிட முடியும்!

17. ஆழக் கற்றலின் முக்கியக் கட்டமைப்புகள்

CNN (சுருள் செய்நரவலை)

"ஆழக் கற்றலின் கண்கள்"

படங்கள், காணொளிகள் போன்ற காட்சித் தரவுகளைப் பகுப்பாய்வு செய்வதில் நிபுணத்துவம் பெற்றவை.

பயன்பாடு: முக அங்கீகாரம் (Face ID), மருத்துவ ஸ்கேன் (MRI), கார்களில் சாலையைக் கண்டறிதல்.

RNN (தொடர் செய்நரவலை)

"ஆழக் கற்றலின் காதுகளும் வாயும்"

மொழி, பேச்சு, பங்குச் சந்தை போன்ற தொடர்ச்சியான (Sequential) தரவுகளைக் கையாள்வதில் சிறந்தவை.

பயன்பாடு: குரல் உதவியாளர்கள் (Siri), தானியங்கி மொழிபெயர்ப்பு, Chatbots.

18. புரட்சிக்கு வித்திட்ட மூன்று தூண்கள்

நரம்பியல் வலைப்பின்னல்கள் என்ற ஐடியா பல ஆண்டுகளாக இருந்தாலும், அதைப் பயிற்றுவிக்கச் சமீபத்திய 3 முன்னேற்றங்களே உதவின:

  • பெருந்தரவுகள் (Big Data): ImageNet போன்ற கோடிக்கணக்கான லேபிளிடப்பட்ட படங்களின் தரவுத்தளங்கள் மாபெரும் உணவாக அமைந்தன.
  • சக்திவாய்ந்த வன்பொருள் (GPUs): வீடியோ கேம்களுக்காக உருவாக்கப்பட்ட GPU-க்கள் ஒரே நேரத்தில் ஆயிரக்கணக்கான கணக்குகளைச் செய்து பயிற்சி நேரத்தைக் குறைத்தன.
  • மேம்பட்ட அல்காரிதம்கள் (Algorithms): Backpropagation போன்ற நுட்பங்களில் ஏற்பட்ட முன்னேற்றங்கள் ஆழமான வலைப்பின்னல்களைப் பயிற்றுவிக்க வழிவகுத்தன.

19. Vanishing Gradient Problem

Whisper Down the Lane

பிழைத் தகவல் (Gradient) கடைசி அடுக்கிலிருந்து முதல் அடுக்குக்குப் பின்னோக்கிச் செல்லும்போது (Backprop), அதன் மதிப்பு மெல்ல மெல்லக் குறைந்து முதல் அடுக்கில் 'சுழியமாக' மறைந்துவிடுகிறது (Vanish).

நீண்ட வரிசையில் நிற்கும் நபர்களிடம் ஒரு ரகசியத்தைச் சொல்லும்போது, அது முதல் நபரைச் சென்றடையும் முன் சிதைந்து போவதைப் போல!

இதனால்தான் பல ஆண்டுகளாக ஆழமான வலைப்பின்னல்களைப் பயிற்றுவிக்க முடியவில்லை. இன்று ReLU, LSTM போன்ற நுட்பங்கள் இதைத் தீர்த்துள்ளன.

Backpropagation and Vanishing Gradient

நான்காவது (மையப்) பொம்மை:
ஜெனரேட்டிவ் AI (Generative AI)

பகுத்தறியும் AI (Discriminative - "இது பூனையா?") vs உருவாக்கும் AI (Generative - "புதிய பூனையை உருவாக்கு!"). படைப்பாற்றலின் புதிய சகாப்தம்.

Artist painting in gallery

20. GANs: கலைஞனும் விமர்சகனும்

Generative Adversarial Networks (GANs)

2014-ல் இயன் குட்ஃபெலோ அறிமுகப்படுத்திய கணினிகளின் “கற்பனைத் திறன்”. இதன் அடிப்படை இரண்டு AI-களுக்கிடையேயான போட்டி!

  • ஜெனரேட்டர் (கலைஞன்): இதன் வேலை, உண்மையான படைப்புகளைப் போலவே, புதிய போலிப் படைப்புகளை உருவாக்குவது.
  • டிஸ்கிரிமினேட்டர் (விமர்சகன்): இதன் வேலை, உண்மையான படைப்பையும், போலிப் படைப்பையும் ஒப்பிட்டு, எது போலி என்பதைக் கண்டுபிடிப்பது.
GAN Learning Cycle

21. GAN-களின் கற்றல் சுற்று & சவால்கள்

கெட்சப் பாட்டில் பயிற்சி

முதல் முயற்சி: கலைஞன் களிம்பு போல ஒன்றை வரைகிறான். விமர்சகன் "இது போலி" என நிராகரிக்கிறான்.

ஆயிரக்கணக்கான முயற்சிகள்: கலைஞன் பாடம் கற்றுக்கொண்டு பாட்டில் வடிவத்திற்கு முன்னேறுகிறான். ஒரு கட்டத்தில் விமர்சகனாலேயே உண்மையா, பொய்யா எனப் பிரிக்க முடிவதில்லை!

படைப்பாற்றலின் இருமுனைக் கத்தி

  • Deepfakes: போலியான செய்தி வீடியோக்களை உருவாக்கிச் சமூகத்தில் குழப்பம் ஏற்படுத்துதல்.
  • Mode Collapse: கலைஞன் ஒரே ஒரு உத்தியை மட்டும் கற்றுக்கொண்டு, அதையே திரும்பத் திரும்ப உருவாக்குதல்.
Next Token Prediction

22. டிரான்ஸ்ஃபார்மர்கள் மற்றும் LLM-கள்

இதுவே இன்று நாம் காணும் ChatGPT, Gemini போன்ற உரையாடல் AI-களின் அடித்தளம்.

  • அடுத்த வார்த்தையைக் கணிப்பது (Next-Token Prediction): இணையப் பக்கங்களைப் படித்து, புள்ளியியல் ரீதியாக அடுத்த வார்த்தையை ஊகிப்பது.
  • கவனத்தின் சக்தி (Attention Mechanism): நீண்ட வாக்கியத்தில் எந்த வார்த்தைகளுக்கு அதிக முக்கியத்துவம் கொடுக்க வேண்டும் என்பதைத் தீர்மானிக்கிறது.
    உ-ம்: "மலைகளின் ராணியான ஊட்டி, மிகவும் குளிர்ச்சியாக இருந்தது" - குளிர்ச்சியாக என்பதை ஊட்டியோடு இணைத்துப் புரிதல்.

23. அளவின் அற்புதம் (The Miracle of Scale)

வெளிப்படும் திறன்கள் (Emergent Abilities)

GPT-3 போன்ற மாதிரிகளில் 175 பில்லியன் அளவுருக்கள் (Parameters / Dials) உள்ளன. தரவுகளின் அளவு ஒரு எல்லையைத் தாண்டும்போது, வெறும் வார்த்தைகளைக் கணித்துக்கொண்டிருந்த இயந்திரம், மலையளவு தரவுகளுக்குள் ஒளிந்திருக்கும் தர்க்கங்களைத் தன்னிச்சையாகப் புரிந்துகொள்கிறது.

"மழை பெய்ததால், ____"

சாதாரண மாதிரி: "தெருக்கள் நனைந்தன" (எளிய கணிப்பு)

மேம்பட்ட LLM: "குழந்தைகள் காகிதங்களுடன் வெளியே ஓடினர்; ஓடைகள் சலசலத்தன" (சூழலைப் புரிந்த கற்பனை)

அடுத்த படி: இயல் மொழி செயலாக்கம் (NLP)

நாம் இதுவரை கண்ட இயந்திரக் கற்றல், ஆழக் கற்றல், மற்றும் உருவாக்கும் AI ஆகியவை ஒரு குறிப்பிட்ட களத்தில் தங்களின் முழுத் திறனையும் வெளிப்படுத்தும் மாயாஜாலக் களம்தான் மனித மொழி! அடுத்த அத்தியாயத்தில் மொழியின் புதிரையும் NLP-யின் அடிப்படைகளையும் ஆழமாக ஆராய்வோம்.

1 / 28