فصل ۱ · قسمت ۲
دو نژادِ متفاوت، دو منطقِ متفاوت
متنِ این قسمت
در قسمتِ قبل گفتیم آن چیزی که با آن گپ میزنید و آن چیزی که روی رادیوگرافی ضایعه را تشخیص میدهد، از دو نسلِ متفاوتاند و با دو منطقِ متفاوت به جواب میرسند. حالا برویم سراغِ اینکه این دو منطق دقیقاً چهاند، چون تمامِ چیزی که در ادامهی این کتاب میآید، از همین تفاوت ریشه میگیرد.
اول اسمِ درست را بگذاریم. آن چیزی که با آن گپ میزنید، یعنی ChatGPT یا جمینای گوگل یا کلود، یک نوع هوش مصنوعی است که به آن میگویند مدلِ زبانیِ بزرگ، یا به اختصار LLM (عبارتِ اختصاریِ Large Language Model). از این به بعد هر جا گفتیم «مدل» یا «LLM»، منظورمان همین خانواده است؛ همان چیزی که میشناسید، فقط با اسمِ فنیاش.
حالا تفاوت. آن نرمافزارِ تشخیصی را تصور کنید که قرار است روی رادیوگرافی پوسیدگی را پیدا کند. چطور ساخته شده؟ به آن هزاران، گاهی صدها هزار رادیوگرافی نشان دادهاند که متخصصها رویشان مشخص کردهاند کجا پوسیدگی هست و کجا نیست. مدل بارها و بارها حدس زده، و هر بار حدسش با آن جوابِ درستِ متخصص مقایسه شده: درست گفتی یا غلط؟ این چرخه آنقدر تکرار شده تا مدل در تشخیص دقیق شود.
نکتهی کلیدی این است: یک پاسخِ درست وجود دارد، بیرون از مدل. پوسیدگی یا واقعاً آنجا هست یا نیست، و این را واقعیتِ دندانِ بیمار تعیین میکند، نه مدل. کلِّ آموزشِ این سیستم یعنی نزدیکشدن به آن حقیقتِ بیرونی.
حالا LLM. این یکی اصلاً اینطور آموزش ندیده. به آن حجمِ عظیمی از متن دادهاند، از کتاب و مقاله تا صفحهی وب و گفتوگو، و کارش در طولِ آموزش فقط یک چیز بوده: حدسزدنِ کلمهی بعدی. جملهای را نیمهکاره جلویش گذاشتهاند و او باید حدس بزند کلمهی بعد چه باید باشد. میلیاردها بار. «آسمان آبی ___» و او یاد میگیرد که «است» محتملتر از «نیست» است. همین، در مقیاسی نجومی.
و این تفاوت، یک تفاوتِ سادهی فنی نیست. دو هدفِ کاملاً متفاوت است. آن نرمافزارِ تشخیصی تمامِ عمرش را صرفِ یک پرسش کرده: چه چیزی درست است؟ مدلِ زبانی تمامِ عمرش را صرفِ پرسشی دیگر کرده: چه چیزی محتمل است که بعد بیاید؟
دقت کنید که این دو، اغلب به یک جواب میرسند، و همین است که مدلِ زبانی را تا این حد کارآمد میکند. چون چیزی که درست است، معمولاً در متنهایی که مدل از آنها یاد گرفته زیاد تکرار شده، و در نتیجه «محتمل» هم هست. وقتی میپرسید پایتختِ فرانسه کجاست، جوابِ درست و جوابِ محتمل یکی است، چون «پاریس» هزاران بار کنارِ این سوال آمده. برای همین مدل بیشترِ وقتها جوابِ درستی میدهد.
ولی این همپوشانی یک تضمین نیست، یک خوشاقبالی است. جایی که «محتمل» و «درست» از هم جدا میشوند، و جدا میشوند، مدل بیدرنگ طرفِ «محتمل» را میگیرد. چون از اساس برای همان ساخته شده. درستی هیچوقت هدفش نبوده.
برای همین نمیشود با LLM مثلِ آن نرمافزارِ تشخیصی رفتار کرد. آن یکی ابزاری است که برای رسیدن به یک پاسخِ درست تنظیم شده. این یکی ابزاری است که برای تولیدِ متنی باورپذیر تنظیم شده، و باورپذیر بودن با درست بودن یکی نیست.
و دقیقاً همینجا یک سوال پیش میآید: اگر مدل دنبالِ درستی نیست و فقط دنبالِ محتملبودن است، پس وقتی چیزی نمیداند چه میکند؟ سکوت که نمیکند. جوابِ این سوال، ما را میبرد به سراغِ یکی از مهمترین چیزهایی که یک دندانپزشک باید دربارهی این ابزار بداند، یعنی موضوعِ قسمتِ بعد.
اول اسمِ درست را بگذاریم. آن چیزی که با آن گپ میزنید، یعنی ChatGPT یا جمینای گوگل یا کلود، یک نوع هوش مصنوعی است که به آن میگویند مدلِ زبانیِ بزرگ، یا به اختصار LLM (عبارتِ اختصاریِ Large Language Model). از این به بعد هر جا گفتیم «مدل» یا «LLM»، منظورمان همین خانواده است؛ همان چیزی که میشناسید، فقط با اسمِ فنیاش.
حالا تفاوت. آن نرمافزارِ تشخیصی را تصور کنید که قرار است روی رادیوگرافی پوسیدگی را پیدا کند. چطور ساخته شده؟ به آن هزاران، گاهی صدها هزار رادیوگرافی نشان دادهاند که متخصصها رویشان مشخص کردهاند کجا پوسیدگی هست و کجا نیست. مدل بارها و بارها حدس زده، و هر بار حدسش با آن جوابِ درستِ متخصص مقایسه شده: درست گفتی یا غلط؟ این چرخه آنقدر تکرار شده تا مدل در تشخیص دقیق شود.
نکتهی کلیدی این است: یک پاسخِ درست وجود دارد، بیرون از مدل. پوسیدگی یا واقعاً آنجا هست یا نیست، و این را واقعیتِ دندانِ بیمار تعیین میکند، نه مدل. کلِّ آموزشِ این سیستم یعنی نزدیکشدن به آن حقیقتِ بیرونی.
حالا LLM. این یکی اصلاً اینطور آموزش ندیده. به آن حجمِ عظیمی از متن دادهاند، از کتاب و مقاله تا صفحهی وب و گفتوگو، و کارش در طولِ آموزش فقط یک چیز بوده: حدسزدنِ کلمهی بعدی. جملهای را نیمهکاره جلویش گذاشتهاند و او باید حدس بزند کلمهی بعد چه باید باشد. میلیاردها بار. «آسمان آبی ___» و او یاد میگیرد که «است» محتملتر از «نیست» است. همین، در مقیاسی نجومی.
و این تفاوت، یک تفاوتِ سادهی فنی نیست. دو هدفِ کاملاً متفاوت است. آن نرمافزارِ تشخیصی تمامِ عمرش را صرفِ یک پرسش کرده: چه چیزی درست است؟ مدلِ زبانی تمامِ عمرش را صرفِ پرسشی دیگر کرده: چه چیزی محتمل است که بعد بیاید؟
دقت کنید که این دو، اغلب به یک جواب میرسند، و همین است که مدلِ زبانی را تا این حد کارآمد میکند. چون چیزی که درست است، معمولاً در متنهایی که مدل از آنها یاد گرفته زیاد تکرار شده، و در نتیجه «محتمل» هم هست. وقتی میپرسید پایتختِ فرانسه کجاست، جوابِ درست و جوابِ محتمل یکی است، چون «پاریس» هزاران بار کنارِ این سوال آمده. برای همین مدل بیشترِ وقتها جوابِ درستی میدهد.
ولی این همپوشانی یک تضمین نیست، یک خوشاقبالی است. جایی که «محتمل» و «درست» از هم جدا میشوند، و جدا میشوند، مدل بیدرنگ طرفِ «محتمل» را میگیرد. چون از اساس برای همان ساخته شده. درستی هیچوقت هدفش نبوده.
برای همین نمیشود با LLM مثلِ آن نرمافزارِ تشخیصی رفتار کرد. آن یکی ابزاری است که برای رسیدن به یک پاسخِ درست تنظیم شده. این یکی ابزاری است که برای تولیدِ متنی باورپذیر تنظیم شده، و باورپذیر بودن با درست بودن یکی نیست.
و دقیقاً همینجا یک سوال پیش میآید: اگر مدل دنبالِ درستی نیست و فقط دنبالِ محتملبودن است، پس وقتی چیزی نمیداند چه میکند؟ سکوت که نمیکند. جوابِ این سوال، ما را میبرد به سراغِ یکی از مهمترین چیزهایی که یک دندانپزشک باید دربارهی این ابزار بداند، یعنی موضوعِ قسمتِ بعد.
کلیدواژهها
مدل زبانی بزرگ (LLM)
هوش مصنوعی تشخیصی
هوش مصنوعی مولد
آموزش مدل هوش مصنوعی
حدس کلمهی بعدی
محتمل در برابر درست
ChatGPT
جمینای
کلود
دادهی آموزشی
منطق تصمیمگیری ماشین
تشخیص پوسیدگی
برچسبها
محتوای مرتبط
بازگشت به فهرست پرامپتولوژیست
← قسمت قبلی
قسمت بعدی →