ChatGPT පාවිච්චි කරන 99%ක් දෙනා AI වැඩ කරන හැටි ඇත්තටම දන්නේ නෑ, (20 Mental Models to Master AI)

Mic
By Mic

Bookmark & Save this

මිනිස්සු සමාජ මාධ්‍ය වල Transformers, Embeddings, RAG, Agents, RLHF වගේ ලොකු වචන පාවිච්චි කරන්නේ හරියට හැමෝම ඒවා ගැන දැනටමත් දන්නවා වගේ. හැබැයි ඇත්තම කතාව, ගොඩක් අය මේවා ගැන මෙලෝ දෙයක් දන්නේ නෑ.

ඇත්තටම AI කියන්නේ ඔයා හිතන තරම් සංකීර්ණ දෙයක් නෙමෙයි. මේකට PhD එකක් ඕනේ නෑ. මේ යටින් තියෙන සංකල්ප 20 (Mental Models) තේරුම් ගත්තාම ChatGPT, Claude, Midjourney ඉඳන් Coding Agents වෙනකම් හැමදේම වැඩ කරන විදිහ ඔයාට එකපාරටම තේරෙන්න පටන් ගනීවි.

The Gap / The Unfair Advantage (99% vs 1%)

99% ක් දෙනා කරන්නේ:

නිකම්ම AI එකට ප්‍රශ්න දානවා, උත්තරේ ගන්නවා. යමක් වැරදුනාම ඇයි වැරදුනේ කියලා හොයාගන්න බැරුව AI එක මෝඩයි කියලා බනිනවා.

1% ක් Elite AI Builders ලා කරන්නේ: AI එකේ යටින් දුවන තාක්ෂණය (Under the hood) තේරුම් අරන්, පද්ධතියක් විදිහට හරියටම AI Systems ගොඩනගන එකයි.

The Cost: $0. මේ මූලික සංකල්ප ටික ඔයාගේ මොළයට දාගන්න එක විතරයි කරන්න තියෙන්නේ.

Step-by-Step Execution (අනිවාර්යයෙන්ම දැනගත යුතු AI සංකල්ප 20)

මේවා කොටස් 4කට කඩලා තියෙනවා. එකින් එක පිළිවෙළට කියවන්න.

කොටස 1: AI වල මූලික අත්තිවාරම (The Foundation)

මේවා තමයි හැම AI එකක්ම හැදිලා තියෙන මූලික ගඩොල් ටික.

Neural Networks: හැම AI එකකම මොළය. Input ලේයර් එකෙන් Data ඇවිත් Hidden layers හරහා ගිහින් Output එකක් එනවා. මේවායේ තියෙන “Weights” (බර) වෙනස් කරන එකට තමයි Training කියලා කියන්නේ.

Tokenization: AI එක වචන සම්පූර්ණයෙන් කියවන්නේ නෑ, ඒවා වචන කෑලි (Tokens) වලට කඩනවා. (උදා: “playing” → “play” + “ing”). රළු ගණනය කිරීමක් විදිහට ටෝකන් 1000ක් කියන්නේ වචන 750ක් විතර.

Embeddings: ටෝකන්ස් ටික AI එකට තේරෙන ඉලක්කම් (Vectors) වලට හරවනවා. මේක හරියට වචන වලට තියෙන Google Maps වගේ. “Doctor” සහ “Nurse” කියන වචන තියෙන්නේ ළඟින්. AI එක වචන තේරුම් ගන්නේ නෑ, දුර සහ දිශාව විතරයි තේරුම් ගන්නේ.

Attention: “Apple” කියන්නේ පලතුරක්ද, නැත්නම් කම්පැනි එකක්ද කියලා තීරණය කරන්නේ වටේ තියෙන වචන වලින්. වාක්‍යයක් එකින් එක කියවනවා වෙනුවට, මුළු වාක්‍යම එකපාර බලලා වචන අතර තියෙන සම්බන්ධය තේරුම් ගන්න එකට Attention කියනවා.

Transformers: අද තියෙන හැම AI මොඩල් එකකම (GPT, Claude) පදනම් Architecture එක. Attention පාවිච්චි කරලා ටෙක්ස්ට් එකක් එකවර (Parallel) ප්‍රොසෙස් කරන නිසා තමයි මේවා මේ තරම් වේගවත්.

කොටස 2: LLMs වැඩ කරන හැටි (What happens when you chat)

ඔයා Prompt එකක් ගහද්දී යටින් වෙන දේ.

LLMs (Large Language Models): ට්‍රිලියන ගණන් වචන වලින් ට්‍රේන් කරපු Transformers.

මුන් කරන්නේ හරිම සරල දෙයක්: “ඊළඟට එන්න ඕන ටෝකන් එක මොකක්ද කියලා අනුමාන කරන එක” (Predict the next token). මේක ට්‍රිලියන ගාණක් පාරක් කරද්දී උන්ට ඉබේම ගණන් හදන්න, කෝඩ් කරන්න පුළුවන් කම ලැබිලා තියෙනවා.

Context Window: AI එකේ මතක සීමාව. GPT-4 වල Tokens 128,000 යි. හැබැයි ලොකුම අවුල තමයි මේකේ මුල සහ අග විතරක් AI එකට මතක හිටිනවා, මැද තියෙන දේවල් අමතක වෙනවා (“Lost in the Middle” problem).

Temperature: උත්තරේ කොච්චර නිර්මාණශීලී වෙන්න ඕනෙද කියලා තීරණය කරන මීටරය. 0 නම් හරිම සරල, ආරක්ෂිත වචන තෝරනවා (කෝඩින් වලට හොඳයි). 1 ට වඩා වැඩි නම් නිර්මාණශීලියි, හැබැයි පිස්සු කෙළින්න පුළුවන් (කතන්දර ලියන්න හොඳයි).

Hallucination: AI එක පට්ටම කන්ෆිඩන්ස් එකෙන් බොරු කියන එක. ඌ හැමවෙලේම උත්සාහ කරන්නේ ඊළඟට එන්න ඕන ලස්සනම වචනය දාන්න මිසක්, ඒක ඇත්තද බොරුද කියලා හොයන්න නෙමෙයි.

Prompt Engineering: ප්‍රශ්නය අහන විදිහ. “AI ගැන කියන්න” කියනවාට වඩා “මම Junior Dev කෙනෙක්, මට REST APIs ගැන උදාහරණයක් එක්ක පියවරෙන් පියවර කියන්න” කිව්වාම එන උත්තරේ සම්පූර්ණයෙන්ම වෙනස්.

කොටස 3: AI Models දියුණු කරන හැටි (How Models Improve)

ලොකු මොඩල්ස් Product එකක් බවට පත් වෙන හැටි.

Transfer Learning: මුල ඉඳන්ම AI එකක් හදන්න කෝටි ගණන් යනවා. ඒ වෙනුවට දැනටමත් ලෝකේ ගැන දන්න AI එකක් අරන්, අපේ වැඩේට අදාළව උගන්වන එක.

Fine-Tuning: Pre-trained මොඩල් එකක් අරන් ඔයාගේ Data වලින් තවදුරටත් ට්‍රේන් කරන එක. (උදා: Legal documents දීලා සාමාන්‍ය AI එකක් ලෝයර් කෙනෙක් කරන එක).

RLHF (Reinforcement Learning from Human Feedback): මිනිස්සුන්ට ඕන විදිහට, ආරක්ෂිතව, ප්‍රයෝජනවත් විදිහට උත්තර දෙන්න AI එක හීලෑ කරන එක. ChatGPT එක ඔයාගේ සහයකයෙක් වගේ හොඳට කතා කරන්නේ මේක නිසයි.

LoRA (Low-Rank Adaptation): Fine-tuning වලට ලොකු Servers ඕනේ. හැබැයි LoRA හරහා මුළු මොඩල් එකම වෙනස් කරන්නේ නැතුව, උඩින් පොඩි ලේයර් එකක් (Adapter) විතරක් ට්‍රේන් කරනවා. සාමාන්‍ය ලැප්ටොප් එකක වුණත් මොඩල්ස් ට්‍රේන් කරන්න පුළුවන් වුණේ මේක නිසයි.

Quantization: ලොකු AI මොඩල්ස් වල බර (Precision එක) අඩු කරලා සාමාන්‍ය පරිගණකයක හෝ ෆෝන් එකක රන් කරන්න පුළුවන් තත්ත්වයට පත් කිරීම (32-bit සිට 4-bit දක්වා).

කොටස 4: සැබෑ ලෝකයේ AI පද්ධති ගොඩනැගීම (Real AI Systems)

ප්‍රායෝගිකව ව්‍යාපාර වලට AI පාවිච්චි කරන හැටි.

RAG (Retrieval-Augmented Generation): AI එකට මතකයෙන් උත්තර දෙන්න නොදී, ඔයාගේ Document එකක් මුලින්ම කියවලා ඒකෙන් උත්තර දෙන්න හදන එක (Open-book exam එකක් වගේ). මේකෙන් Hallucination 100% ක්ම වගේ නැති වෙනවා.

Vector Databases: RAG වලට තොරතුරු හොයාගන්න ඕනෙ වචන වලින් නෙමෙයි, “තේරුම” (Meaning) හරහායි. ඒකට පාවිච්චි කරන්නේ මේ Vector DBs. (උදා: Pinecone, Qdrant).

AI Agents: Chatbot කෙනෙක් ප්‍රශ්නෙට උත්තර දීලා නිකම් ඉන්නවා. හැබැයි Agent කෙනෙක් අන්තර්ජාලයට ගිහින්, කෝඩ් රන් කරලා, වැඩේ ඉවර වෙනකම් තනියම කරනවා (Think → Act → Observe → Repeat).

Chain of Thought (CoT): එකපාර උත්තරේ දෙන්න නොදී, “පියවරෙන් පියවර හිතලා බලන්න” (Think step by step) කියලා AI එකට හිතන්න ඉඩ දෙන එක. සංකීර්ණ ගණිත ගැටළු විසඳන්නේ මෙහෙමයි.

Diffusion Models: රූප සහ වීඩියෝ හදන AI (Midjourney, Sora) වැඩ කරන විදිහ. මුලින්ම රූපයකට Noise (තිත්) දාලා විනාශ කරලා, ආයෙත් ඒ Noise එක පියවරෙන් පියවර අයින් කරලා අලුත් රූපයක් මවන ක්‍රමය.

The Math / The ROI (මේවා දැනගැනීමේ ආයෝජන ප්‍රතිලාභය)

සාමාන්‍ය කෙනෙක් AI පාවිච්චි කරන්නේ මැජික් එකක් වගේ. යමක් වැරදුනාම ඒක හදාගන්න ඔවුන් දන්නේ නෑ.

හැබැයි මේ වචන 20 පිටිපස්සේ තියෙන තර්කය (Mental Models) තේරුම් ගත්තාම, ඔයාට පුළුවන් AI System Architecture එකක් හරියටම ප්ලෑන් කරන්න. RAG එකක් ෆේල් වෙද්දී ඒක වෙන්නේ Vector Search එකේ අවුලක් නිසාද, නැත්නම් Context Window එක පිරිලා නිසාද කියලා ඔයාට තත්පරෙන් හොයාගන්න පුළුවන්. මේ දැනුම තමයි සාමාන්‍ය Coder කෙනෙක්ගෙන් System Architect කෙනෙක්ව වෙන් කරන්නේ.

The Uncomfortable Truth (තිත්ත ඇත්ත)

ගොඩක් අය දිනපතා AI පාවිච්චි කළත් මේ දේවල් දන්නේ නෑ. ඔවුන් තාමත් හිතන්නේ “AI එක මගේ ප්‍රශ්නෙට හරියටම උත්තර දෙයි” කියලා.

ඒ නොදන්නාකම (Knowledge Gap) තමයි ඔයාගේ ලොකුම වාසිය (Edge). අනිත් අය වචන පටලවගෙන ඉද්දි, ඔයා මේ අත්තිවාරම හරියටම තේරුම් අරන් සැබෑ AI පද්ධති ගොඩනගන්න පටන් ගන්න. අදම මේක ඔයාගේ අනාගත නිර්මාණ සඳහා පදනමක් කරගන්න.

-Shalinda Jayasinghe-

Share This Article