அத்தியாயம் 2:
அறிவின் அடுக்குகள்

AI, Machine Learning, Deep Learning மற்றும் Generative AI-இன் மாயாஜால உலகம்

தொழில்நுட்பப் பொது விரிவுரை

1. அறிமுகம்: ஒரு மாபெரும் குழப்பம்

செய்யறிவு (AI) இன்று நமது வாழ்வின் ஒவ்வொரு இழையிலும் பின்னிப் பிணைந்துவிட்டது. ஆனால், மாயாஜாலத் திரைக்குப் பின்னால் ஒளிந்திருக்கும் உண்மை என்ன?

ஒரு பொதுவான குழப்பம்:

பெரும்பாலானோர் AI, Machine Learning, Deep Learning ஆகிய வார்த்தைகளை ஒரே அர்த்தத்தில் பயன்படுத்துகிறார்கள். ஆனால், அவை ஒவ்வொன்றும் வேறுபட்டவை; அதே சமயம் ஒன்றோடொன்று பிரிக்க முடியாதவை.

இந்தக் குழப்பத்தைத் தீர்க்க, ஒரு சிறந்த உவமையை நாம் துணைக்கு அழைப்போம்!

Russian Nesting Dolls Matryoshka

2. உவமை: ரஷ்யாவின் மரப் பொம்மைகள்

ஒன்றுக்குள் ஒன்றாகப் பொருத்தப்பட்டிருக்கும் ரஷ்யாவின் புகழ்பெற்ற மரப் பொம்மைகளை (Matryoshka dolls) கற்பனை செய்துபாருங்கள்.

  • பெரிய பொம்மை: செய்யறிவு (AI)
  • இரண்டாவது: மெஷின் லேர்னிங் (Machine Learning)
  • மூன்றாவது: டீப் லேர்னிங் (Deep Learning)
  • மையப் பொம்மை: ஜெனரேட்டிவ் AI (Generative AI)

இவை தனித்தனித் தீவுகள் அல்ல. ஒன்றுக்குள் ஒன்றாகப் பின்னிப் பிணைந்திருக்கும் அறிவின் அடுக்குகள்.

3. முதல் பொம்மை: செய்யறிவு (The Big Picture)

செய்யறிவு (AI): இதை ஒரு தனிப்பட்ட மென்பொருள் என்று நினைத்துவிடாதீர்கள். இது எல்லாவற்றையும் தனக்குள் அடக்கிய ஒரு ‘மாபெரும் குடை’ (Umbrella Term).

இதன் லட்சியம் என்ன?

மனிதனைப் போலவே சிந்திக்கவும், திட்டமிடவும், மொழியைப் புரிந்து கொள்ளவும், சில சமயங்களில் நம்மை விடச் சிறப்பாகச் செயல்படவும் கூடிய இயந்திரங்களை உருவாக்குவதே இதன் மாபெரும் தேடல்.

Artificial Intelligence Big Picture

4. இரண்டு வகை ஆட்டக்காரர்கள்

1. குறுகிய AI (Narrow AI)

“ஸ்பெஷலிஸ்ட்”

இன்று நாம் பயன்படுத்தும் அனைத்து AI-களும் இந்த வகையே.

  • ஒரு குறிப்பிட்ட வேலையைச் செய்வதில் கில்லாடிகள்.
  • சதுரங்க AI-யிடம் காபி கேட்டால் விழிக்கும்!
  • சுருக்கம்: ஒரே ஒரு வேலையை மனிதனை விடச் சிறப்பாகச் செய்யும் நிபுணன்.

2. பொது AI (General AI - AGI)

“ஆல் ரவுண்டர்”

இதுதான் AI ஆராய்ச்சியின் புனிதக் கிண்ணம் (Holy Grail).

  • மனிதனைப் போலவே எந்தவொரு புதிய செயலையும் கற்கும் திறன்.
  • காலையில் கணக்கு, மதியம் கவிதை, மாலையில் ஆலோசனை.
  • சுருக்கம்: பல துறைகளிலும் அறிவைப் பயன்படுத்தும் ‘சகலகலா வல்லவன்’.

5. AI-யின் இரண்டு பாதைகள் (எதிரிகள் அல்ல, கூட்டாளிகள்)

பள்ளி 1: குறியீட்டு AI (Symbolic AI) பள்ளி 2: மெஷின் லேர்னிங் (Machine Learning)
“கறார் வாத்தியார் முறை” “ஸ்மார்ட் மாணவன் முறை”
மனித அறிவை அப்படியே விதிகளாக (Rules) மாற்றி கணினிக்குப் புகட்டுதல். விதிகளைச் சொல்லிக் கொடுக்காமல் தரவுகளைக் (Data) கொடுத்துக் கற்க வைத்தல்.
IF நோயாளிக்கு காய்ச்சல் THEN பாராசிட்டமால் கொடு (Expert Systems). ஆயிரக்கணக்கான படங்களைக் காட்டி 'இது பூனை' எனக் கற்றுக் கொடுத்தல்.
தெளிவான கட்டமைப்பு & லாஜிக் வழங்குகிறது. நெகிழ்வுத்தன்மையையும், முடிவற்ற கற்கும் திறனையும் வழங்குகிறது.

6. கலை உலகில் AI: ஒரு விவாதம்

Théâtre d’Opéra Spatial

2022-ம் ஆண்டு, கொலராடோ கலைக் கண்காட்சியில் முதல் பரிசை வென்ற ஓவியத்தை வரைந்தது ஒரு மனிதர் அல்ல, Midjourney என்ற AI.

இது எழுப்பிய கேள்விகள்:

  • AI-ஆல் உருவாக்கப்பட்ட ஒரு படைப்பைக் ‘கலை’ என்று அழைக்கலாமா?
  • இதன் உண்மையான கலைஞர் யார்?
  • படைப்பாற்றல் என்பது மனிதனுக்கு மட்டுமே உரித்தான ஒன்றா?
Abstract Art representation

இரண்டாவது பொம்மை:
மெஷின் லேர்னிங் (Machine Learning)

இது சும்மா ஒரு தொழில்நுட்பம் அல்ல; கணினி வரலாற்றின் ‘பழைய ஏற்பாட்டை’ கிழித்து எறிந்துவிட்டு, ‘புதிய ஏற்பாட்டை’ எழுதிய ஒரு புரட்சியாளன்!

7. ரோபோ சமையல்காரன் vs புத்திசாலி மாணவன்

1. பழைய பள்ளி முறை (Traditional)

இது ஒரு கண்டிப்பான வாத்தியார் முறை போன்றது. கணினிக்குச் சொந்தமாகச் சிந்திக்கும் திறன் கிடையாது.

தரவு (Data) + விதிகள் (Rules) = பதில்கள் (Answers)

உ-ம்: இணையதள வரி (Tax) கணக்கீடு.

2. புதிய புரட்சி முறை (Machine Learning)

இங்குதான் மாயாஜாலம்! சமன்பாடு அப்படியே தலைகீழாக மாறுகிறது.

தரவு (Data) + பதில்கள் (Answers) = விதிகள் (Rules)

விதியை (Rule) கணினியே கண்டுபிடிக்கிறது! உ-ம்: பூனையை அடையாளம் காணுதல்.

Hacker / Spam representation

8. ஸ்பேம் ஃபில்டர்: ஒரு துப்பறியும் நிபுணர்

பழைய முறைச் சிக்கல்: "பரிசு" என்று வந்தால் குப்பையில் போடு என விதி எழுதினால், மோசடிக்காரன் "ப.ரி.சு" என்று மாற்றி ஏமாற்றுவான்.

மெஷின் லேர்னிங்கின் மேஜிக் (Pattern Recognition):

  • "இந்த நபர் இதுவரை உங்களுக்கு மெயில் அனுப்பியதே இல்லை."
  • "இந்த மெயில் நள்ளிரவு 2 மணிக்கு நைஜீரியாவிலிருந்து வந்துள்ளது."
  • "தலைப்பில் நிறைய டாலர் ($$$) குறிகள் உள்ளன."

இதை வைத்து, “இது ஸ்பேம்!” என்ற புதிய விதியை அதுவே உருவாக்கும்.

9. கற்றலின் மூன்று முக்கியப் பாதைகள்

1. Supervised Learning

ஆசான் வழி கற்கும் முறை (Labelled Data).

2. Unsupervised Learning

சுயமாகக் கண்டறியும் முறை (Unlabeled Data).

3. Reinforcement Learning

முயற்சி மற்றும் பிழையிலிருந்து கற்கும் முறை (Trial & Error).

10. ஆசான் வழி கற்கும் முறை (Supervised Learning)

இங்கே கணினிக்குத் தரவுகள் மட்டும் வழங்கப்படுவதில்லை; கூடவே அதற்கான சரியான விடைகளும் (Labels) கையில் கொடுக்கப்படுகின்றன.

வகுப்பறையில் என்ன நடக்கிறது?

  • பயிற்சி: 10,000 படங்களைக் காட்டி "இது பூனை", "இது நாய்" என லேபிளோடு கற்பித்தல்.
  • கற்றல்: நுட்பமான வடிவங்களை (காது, வாய்) அதுவே கிரகிக்கிறது.
  • பரீட்சை: புதிய படத்தைக் காட்டியதும், "95% அடையாளங்கள் நாயோடு பொருந்துகிறது" என வகைப்படுத்துகிறது (Classification).

தொழில்நுட்பக் குறிப்பு:

குப்பையான உள்ளீடு = குப்பையான வெளியீடு (Garbage In, Garbage Out). நீங்கள் கொடுக்கும் லேபிள்கள் தவறென்றால், பதிலும் தவறே!

11. நிதர்சன உண்மை: AI-யின் பின்னாலிருக்கும் மனித வியர்வை!

Supervised Learning திட்டத்தின் மிகப்பெரிய சவால் அல்காரிதம்களோ கணினிகளோ அல்ல. அது ‘தரவு லேபிளிங்’ (Data Labeling) என்ற மனித வேலைதான்!

உ-ம்: ஓட்டுநர் இல்லா கார்கள் (Self-Driving Cars)

லட்சக்கணக்கான வீடியோக்களில் தோன்றும் ஒவ்வொரு மனிதர், சிக்னல் மீதும் மனிதர்கள் உட்கார்ந்து கையால் கட்டம் போட்டு (Bounding Box), "இது மனிதர்" என்று லேபிளிட வேண்டும்.

Amazon Mechanical Turk போன்ற தளங்கள் மூலம் ஆயிரக்கணக்கான மனிதர்கள் திரைக்குப் பின்னால் உழைக்கிறார்கள்.

Data annotation concept

12. சுயமாகக் கண்டறியும் முறை (Unsupervised Learning)

கணினிக்கு லேபிள்கள் இல்லாத, வகைப்படுத்தப்படாத மூலத் தரவுகள் (Raw, Unlabeled Data) மட்டுமே கொடுக்கப்படும். விடை சொல்லிக் கொடுக்கப்படாது.

எடுத்துக்காட்டு: பல்பொருள் அங்காடி தரவு

வாங்கிய பொருட்கள், வாங்கும் அதிர்வெண், செலவழித்த தொகை போன்ற லேபிளிடப்படாத தரவுகள்.

AI எப்படி வேலை செய்கிறது? (Clustering):

  • தரவுக் கடலில் மூழ்கி, ஒத்த பண்புகள் கொண்ட வாடிக்கையாளர்களைத் தானாகவே குழுக்களாகப் பிரிக்கிறது (K-Means Clustering, RFM Analysis).

13. வணிக மேஜிக்: AI பிரித்துக் கொடுக்கும் 3 குழுக்கள்

1. VIP வாடிக்கையாளர்கள்

அடையாளம்: அடிக்கடி வருபவர்கள், அள்ளிச் செலவழிப்பவர்கள்.

உத்தி: தள்ளுபடி வேண்டாம்; அங்கீகாரமும், பிரத்யேக உறவு மேலாளரும் (VIP Status) கொடுங்கள்.

2. தள்ளுபடித் தென்றல்கள்

அடையாளம்: சலுகை இருந்தால் மட்டுமே வருவார்கள்.

உத்தி: VIP சலுகை வீண். "இன்று மட்டும் 50% ஆஃபர்" போன்ற ஃப்ளாஷ் விற்பனை அறிவிப்புகளை அனுப்புங்கள்.

3. புதிய மொட்டுகள்

அடையாளம்: முதல் முறையாக வாங்கியவர்கள்.

உத்தி: அன்பான வரவேற்புத் தள்ளுபடியும், லாயல்டி திட்டமும் வழங்கி விசுவாசமாக மாற்றுங்கள்.

Self driving autonomous car

14. முயற்சி மற்றும் பிழையிலிருந்து கற்றல் (Reinforcement)

இயந்திரம் ஒரு செயலி (Agent) ஆகச் செயல்படுகிறது. ஒரு குழந்தை சூடான அடுப்பைத் தொட்டு வலிப்பதன் மூலம் கற்பது போல, தவறுகளிலிருந்து கற்கிறது.

உ-ம்: ரோபோ டாக்ஸி (Robot Taxi)

  • பயணியைப் பாதுகாப்பாக இறக்கினால் = வெகுமதி (Reward).
  • சிகப்பு விளக்கை மீறினால் = தண்டனை (Penalty).
  • நீண்ட காலத்தில் மொத்த வெகுமதிகளை அதிகப்படுத்தும் விதிகளை அதுவே கற்றுக்கொள்கிறது.

15. ஒரு வரலாற்றுத் தருணம்:
AlphaGo-வின் “நகர்வு 37”

2016-ல், உலக சாம்பியன் லீ செடாலுடன் நடந்த 'கோ' (Go) விளையாட்டில், கூகிளின் AlphaGo தனது 37-வது நகர்வைச் செய்தது. மனித வரலாற்றில் யாரும் பார்த்திராத விசித்திரமான நகர்வு அது.

அனைத்து மனித நிபுணர்களும் அதை ஒரு மாபெரும் பிழை என்று கருதினர். ஆனால், அந்த ஒற்றை நகர்வுதான் ஆட்டத்தின் போக்கையே மாற்றி AlphaGo-வுக்கு வெற்றியைத் தேடித்தந்தது. இயந்திரங்கள் மனித அறிவுக்கு அப்பாற்பட்ட புதிய, ஆக்கப்பூர்வமான அறிவை உருவாக்க முடியும் என உலகம் உணர்ந்த தருணம்!

1 / 17