Main

Is AI Actually Useful?

Get Magical AI for free and save 7 hours every week: https://getmagical.com/patrick A new Harvard Business School study analyzed the impact of giving AI tools, to white collar workers at Boston Consulting Group. In the study, management consultants who were told to use Chat GPT when carrying out a set of consulting tasks were far more productive than their colleagues who were not given access the tool. Not only did AI-assisted consultants carry out tasks 25 per cent faster and complete 12 per cent more tasks overall, but their work was also assessed to be 40 per cent higher in quality than their unassisted peers. In today's video we look at the pros and cons of using AI at work. Harvard Paper: https://www.hbs.edu/ris/Publication%20Files/24-013_d9b45b68-9e74-42d6-a1c6-c72fb70c7282.pdf Nicholas Carlini Blog: https://nicholas.carlini.com/writing/2024/my-benchmark-for-large-language-models.html Nicholas Carlini Quiz: https://nicholas.carlini.com/writing/llm-forecast/ Effects of AI on Employment Paper: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4527336 Patrick's Books: Statistics For The Trading Floor: https://amzn.to/3eerLA0 Derivatives For The Trading Floor: https://amzn.to/3cjsyPF Corporate Finance: https://amzn.to/3fn3rvC Ways To Support The Channel Patreon: https://www.patreon.com/PatrickBoyleOnFinance Buy Me a Coffee: https://www.buymeacoffee.com/patrickboyle Visit our website: www.onfinance.org Follow Patrick on Twitter Here: https://twitter.com/PatrickEBoyle Patrick Boyle On Finance Podcast: Spotify: https://open.spotify.com/show/7uhrWlDvxzy9hLoW0EYf0b Apple: https://podcasts.apple.com/us/podcast/patrick-boyle-on-finance/id1547740313 Google Podcasts: https://tinyurl.com/62862nve Join this channel to support making this content: https://www.youtube.com/channel/UCASM0cgfkJxQ1ICmRilfHLw/join

Patrick Boyle

2 days ago

أعلن Jensen Huang - المؤسس والرئيس التنفيذي لشركة NVIDIA في مكالمة أرباحهم يوم الأربعاء أن الذكاء الاصطناعي التوليدي قد وصل إلى نقطة تحول. ومضى يقول إن الطلب على رقائق الذكاء الاصطناعي يتزايد في جميع أنحاء العالم عبر الشركات والصناعات والدول. لقد كانت Nvidia أكبر محرك منفرد للعائدات في مؤشر S&P500 حتى الآن هذا العام، وتدعي معظم الشركات الأخرى ذات الأداء الأفضل أنها رائدة في مجال الذكاء الاصطناعي، لذا ما مدى فائدة هذه الأدوات الجديدة وإلى أي مدى يحتاج الناس إلى تعلم كيفية القيام بذلك؟ لاستخدامها
لتحقيق النجاح في مكان العمل في المستقبل؟ نشر نيكولاس كارليني، عالم الأبحاث في Google DeepMind، تدوينة قبل بضعة أيام يفحص فيها استخدامه لمجموعة متنوعة من نماذج الذكاء الاصطناعي الكبيرة للغات لمحاولة فهم ما تجيده هذه النماذج وأين تفشل. لقد وجدت المنشور مثيرًا للاهتمام حقًا، حيث أدهشني كيف يمكن لهذه النماذج أن تنجح في بعض المهام المعقدة حقًا، ولكنها تفشل بعد ذلك في المهام التي قد تتخيل أنها ستكون سهلة بالنسبة لهم. يمكنهم القيام بحساب التفاضل والتكامل، ولكن بعد ذلك يجدون صعوبة في العد. لقد فوجئت عند
ما رأيت أن الذكاء الاصطناعي كان قادرًا على كتابة تعليمات برمجية لإنشاء موقع ويب يعرض العلم الأمريكي الذي تغير لونه عند النقر عليه ولكنه لم يتمكن بعد ذلك من كتابة تعليمات برمجية تظهر رسم كعكة أثناء تشغيل أغنية "عيد ميلاد سعيد". يبدو أن هاتين المهمتين لهما نفس الصعوبة، لكن النتائج كانت مختلفة حقًا. يوضح كارليني أن GPT4 يمكنه كتابة تعليمات برمجية لإنشاء موقع ويب يمكنك من خلاله لعب tic tac toe ولكنه غير قادر على العثور على الحركة الفائزة في لعبة tic tac toe - والتي تبدو وكأنها مهمة أبسط بكثير. إن فك
رة أن الذكاء الاصطناعي يمكن أن يتفوق في المهام المعقدة مثل توليد الأفكار، في حين يكافح في المهام التي ينبغي أن يكون من السهل على الآلات القيام بها (مثل الرياضيات الأساسية) تزيد من الارتباك حول مدى فائدتها في الواقع. وبالنظر إلى هذه النتائج المدهشة، فهل تكون نماذج الذكاء الاصطناعي الحالية مفيدة في مكان العمل، أم أننا بحاجة إلى انتظار تحسنها قبل استخدامها؟ يتيح لك الاختبار الموجود على موقع Carlini الإلكتروني تخمين مدى جودة أداء الذكاء الاصطناعي في المهام المختلفة، مما يمنحك شعورًا بمدى فهمك لقدرات
ه. الكثير من الالتباس حول فائدة هذه النماذج يأتي من مزيج من الأشخاص الذين يبالغون في قدراتهم وحقيقة أن مطوريهم لا يقدمون الكثير من الإرشادات حول أفضل الطرق لاستخدام هذه الأنظمة التي يبدو أنها يتم تعلمها في الغالب عن طريق التجربة والتجربة. - الخطأ وتبادل الخبرات عبر الإنترنت. لقد كان هناك عدد من الإنجازات المهمة في مجال الذكاء الاصطناعي على مدى العقد الماضي. لقد هزم برنامج AlphaGo، وهو برنامج قائم على الذكاء الاصطناعي، أحد لاعبي Go بطل العالم في عام 2016، وهو ما كان أمرًا كبيرًا للغاية وحظي باهتم
ام كبير من الصحافة في ذلك الوقت ولكنه سرعان ما تلاشى من اهتمام الجمهور. لقد استحوذت تطبيقات الذكاء الاصطناعي التوليدية مثل ChatGPT وGitHub Copilot وMidjourney وغيرها على خيال الجمهور أكثر بكثير من AlphaGo، نظرًا لتوفرها والأهم من ذلك سهولة استخدامها - يمكن لأي شخص تقريبًا إنشاء حساب مجاني واستخدام هذه النماذج مع بجانب عدم التدريب. يمكن لأحدث تطبيقات الذكاء الاصطناعي أن تؤدي المهام الروتينية بسهولة - وهو أمر مفيد، ولكن قدرتها على كتابة النصوص وتأليف الموسيقى وإنشاء الفن الرقمي هي التي أذهلت الجمه
ور وجذبتهم لتجربة هذه النماذج بطريقة لم يسبق لها مثيل. التقدم التقني في هذا المجال لم يفعل ذلك. ونتيجة لذلك، يحاول الجميع، من الأطفال الصغار إلى المحترفين، فهم تأثير الذكاء الاصطناعي التوليدي على الأعمال والمجتمع، ولكن دون الكثير من التعليمات حول مكان نجاح هذه النماذج ومكان فشلها. وفقًا لشركة ماكينزي، يمكن للذكاء الاصطناعي التوليدي أن يتيح أتمتة ما يصل إلى 70% من الأنشطة التجارية، في جميع المهن تقريبًا، من الآن وحتى عام 2030. ويجادلون بأن الذكاء الاصطناعي من المرجح أن يؤثر على ساعات العمل والمها
م والمسؤوليات للعاملين عبر معدلات الأجور والتعليم. سيكون لها تأثير عميق بشكل خاص على المهن التي تتطلب تقليديا مستويات أعلى من التعليم، والتي كان عملها أقل تأثرا بالأتمتة في الماضي. تسلط ورقة عمل حديثة من كلية هارفارد للأعمال بعنوان "الدليل التجريبي الميداني لتأثيرات الذكاء الاصطناعي على إنتاجية وجودة العاملين في مجال المعرفة" الضوء على فائدة هذه النماذج من خلال دراسة كيف كان المستشارون الإداريون عند منحهم إمكانية الوصول إلى نماذج الذكاء الاصطناعي التوليدي أثناء العمل على مهام واقعية أكثر منتجة و
ذات جودة أعلى الإخراج من أولئك الذين لا يستطيعون الوصول إلى الذكاء الاصطناعي. وأظهر التحليل -وهو الأهم- المواقف التي فشلت فيها النماذج، وكيف تفاعل المستشارون مع الأدوات. كان لدى المستشارين الذين لديهم إمكانية الوصول إلى الذكاء الاصطناعي الحرية في تجاهل حلول الذكاء الاصطناعي إذا أرادوا ذلك، ونظرت الدراسة في عدد المرات التي اختاروا فيها القيام بذلك، ومدى جودة هذه القرارات. توضح الورقة الظروف التي قد تستفيد فيها المؤسسات والأفراد من استخدام الذكاء الاصطناعي، وكيف يمكن أن يتغير ذلك مع تحسن التكنولوج
يا بمرور الوقت. قبل التعمق في نتائج الدراسة، دعوني أخبركم عن الشركة الراعية لفيديو اليوم Magical. Magical هو امتداد مجاني لمتصفح Chrome تم تصميمه لمساعدتك على تقليل أعمالك المزدحمة من خلال أتمتة مهامك باستخدام الذكاء الاصطناعي. يتم إعداده في ثوانٍ ويمكنه توفير ساعات طويلة كل أسبوع عن طريق أتمتة جميع أنواع المهام الإدارية المتكررة مثل المراسلة وإدخال البيانات والمزيد. يمكنك إعداد القوالب باستخدام اختصارات لوحة المفاتيح لأتمتة المهام مثل كتابة روابط التكبير/التصغير الخاصة بالاجتماعات دون الحاجة إل
ى فتح التكبير/التصغير في كل مرة، أو إنشاء قوالب بريد إلكتروني يمكنك استخدامها مرارًا وتكرارًا. إن الشيء الرائع في Magical هو أنه يمكنك إضافة عناصر نائبة مثل الاسم الأول أو الشركة أو أي نوع آخر من المعلومات التي تريدها في هذه القوالب التي يتم تعبئتها تلقائيًا عند توسيعها. بهذه الطريقة، لن تضطر أبدًا إلى كتابتها وسيقوم Magical بتخصيص جميع رسائلك لك، مما يوفر لك الكثير من الوقت. يحتوي Magical على ميزة الرد بنقرة واحدة والتي تتيح لك الرد بسرعة على أي رسالة عبر الويب. ترى هذه الأزرار تظهر تحت أي رسال
ة تقرأها ويمكن أن تضغط على نعم أو لا أو مخصص، ويستخدم الذكاء الاصطناعي لكتابة الرد المناسب في ضوء سياق الرسالة. إنه يوفر عليك الكثير من الوقت حقًا. احصل على Magical مجانًا من خلال الانتقال إلى القطع السحرية للأمام من dot com Patrick أو من خلال النقر على الرابط الموجود في وصف الفيديو. كانت دراسة هارفارد عبارة عن تجربة مسجلة مسبقًا تم إجراؤها مع مجموعة بوسطن الاستشارية، وهي شركة استشارية رفيعة المستوى. وقد شارك فيها 758 من المستشارين ذوي المهارات العالية في مجال استراتيجية مجموعة بوسطن الاستشارية،
حيث تم تعيين المشاركين في واحدة من ثلاث مجموعات بعد تحديد خط الأساس للأداء لأول مرة. مجموعة لا تتمتع بإمكانية الوصول إلى الذكاء الاصطناعي، ومجموعة تتمتع بإمكانية الوصول إلى GPT-4، ومجموعة تتمتع بإمكانية الوصول إلى GPT-4 مع نظرة عامة هندسية سريعة زادت من إلمامهم بالذكاء الاصطناعي. تضمنت النظرة العامة الهندسية السريعة مقاطع فيديو ومستندات تعليمية توضح استراتيجيات الاستخدام الفعالة. تهدف التجربة إلى فهم كيف يمكن لتكامل الذكاء الاصطناعي أن يعيد تشكيل سير العمل للعاملين في مجال المعرفة ذوي المهارات
العالية الذين عملوا تقليديًا دون مساعدة الذكاء الاصطناعي. في التجربة، تم تحفيز الاستشاريين على الأداء بأفضل شكل ممكن في المهام الموكلة إليهم، وقيل لهم إن أفضل 20% من أصحاب الأداء سيتم الاعتراف بهم من قبل اللجنة التي تشرف على تطويرهم الوظيفي، مما يعني أنه لم يكن هناك أي حافز لمحاولة ذلك. تحريف النتائج عن طريق تعمد أداء ضعيف في المهام. أراد جميع المشاركين الأداء بأفضل شكل ممكن. تضمنت الدراسة تجربتين متميزتين. تضمنت التجربة الأولى إعطاء الاستشاريين مشكلات لحلها كانت ضمن قدرات نموذج الذكاء الاصطناعي
الذي كانوا يستخدمونه، أما التجربة الثانية – فقد أعطت الاستشاريين ما تم وصفه بأنه "مهام خارج الحدود" وهي مهام مصممة خصيصًا بحيث لم يتمكن الذكاء الاصطناعي من إكمالها بسهولة من خلال نسخ التعليمات ولصقها كمطالبة. ونظرًا لأن هذه النماذج جديدة وسريعة التطور، فقد يكون من الصعب على المستخدمين فهم المجالات التي يمكن أن يكون فيها الذكاء الاصطناعي مفيدًا، والمجالات التي قد يكون استخدامه فيها غير مناسب. ويصف المؤلفون هذا بالحدود التكنولوجية الخشنة حيث يمكن تنفيذ بعض المهام بسهولة بواسطة الذكاء الاصطناعي، ف
ي حين أن بعضها الآخر، على الرغم من تشابهها في الصعوبة على ما يبدو، إلا أنها تقع خارج قدرة النماذج. تم تصميم الدراسة لفهم تأثير هذه النماذج على الإنتاجية على العمال ذوي المهارات العالية وفهم كيفية تنقل المهنيين في هذه الحدود المتعرجة. بعض الارتباك في فهم قدرة نماذج اللغات الكبيرة يأتي من حقيقة أن هذه النماذج تتمتع بقدرات مدهشة لم يتم إنشاؤها خصيصًا لامتلاكها، ولهذا السبب حتى مطوريها ليسوا متأكدين من أين تكمن هذه الحدود التكنولوجية المتعرجة. ركزت دراسة جامعة هارفارد على المهام المعقدة التي تم تطوي
رها لتكون واقعية وتم تصميمها بمساهمة المتخصصين. قال أحد كبار المسؤولين التنفيذيين في مجموعة بوسطن الاستشارية إن هذه المهام "تتوافق إلى حد كبير مع أنشطة العمل اليومية" للأشخاص المعنيين. توضح الورقة أن إصدارات هذه المهام تستخدم بالفعل من قبل مجموعة بوسطن الاستشارية لفحص المتقدمين للوظائف، وعادةً ما يكونون من خلفيات أكاديمية النخبة لشغل وظائف داخل الشركة. في كل تجربة، قام المشاركون أولاً بمهمة دون مساعدة الذكاء الاصطناعي، لتحديد خط أساس للأداء. بعد ذلك، تم تقسيم المشاركين بشكل عشوائي إلى إحدى المجم
وعات الثلاث لتقييم تأثير الذكاء الاصطناعي على عملهم. ووجدت الدراسة أن الأداء في المهمة الأولية كان تنبؤيا بالأداء في المهام التجريبية، مما يعني أن المهام كانت ذات صعوبة مماثلة واختبار مهارات مماثلة. جاءت كل مهمة مع تخصيص وقت لها، لكن الدراسة ركزت أكثر على الاختلافات النوعية بدلاً من تحسينات السرعة الناتجة عن استخدام الذكاء الاصطناعي. بالنسبة لـ "المهمة داخل الحدود" - أي المهمة التي من المتوقع أن يكون الذكاء الاصطناعي مفيدًا فيها، تم تكليف المشاركين أولاً بالتوصل إلى فكرة جديدة للمشروبات - كمهمة
تحكم ، ثم التوصل إلى فكرة جديدة للأحذية. للأسواق المتخصصة كمهمة التجربة. كان على الاستشاريين تحديد كل خطوة معنية، بدءًا من وصف النموذج الأولي وحتى تجزئة السوق إلى دخول السوق. تحقق أحد المسؤولين التنفيذيين من شركة أحذية عالمية رائدة من أن تصميم المهمة يغطي العملية الكاملة التي تمر بها شركتهم عادةً. تتطلب المهمة الإبداع والتفكير التحليلي وإتقان الكتابة والإقناع في طرح الفكرة. كان أداء الاستشاريين الذين يستخدمون الذكاء الاصطناعي أفضل بنسبة 38% من أولئك الذين لا يملكون الذكاء الاصطناعي، وكان أداء ال
مستشارين الذين يستخدمون الذكاء الاصطناعي والذين تلقوا تدريبًا أفضل بنسبة 42.5% من أولئك الذين لا يتمتعون بإمكانية الوصول إلى الذكاء الاصطناعي. لذلك، أدى الذكاء الاصطناعي إلى تحسين الأداء، كما أدى الذكاء الاصطناعي بالإضافة إلى التدريب إلى تحسين الأداء بشكل أكبر. في حين أن السرعة لم تكن محور الدراسة، فقد أكملت المجموعة الضابطة في المتوسط ​​82% من مهامها، في حين أكملت مجموعة الذكاء الاصطناعي 91% من مهامها وأكملت مجموعة الذكاء الاصطناعي بالإضافة إلى التدريب 93% من المهام. لذلك، لم يؤدي الوصول إلى ال
ذكاء الاصطناعي إلى تحسين جودة العمل فحسب، بل أدى أيضًا إلى تحسين إنتاجية العمال. كان الجزء المثير للاهتمام من هذه الدراسة هو أن أهم المستفيدين من الوصول إلى الذكاء الاصطناعي هم العمال الأقل مهارة. في حين تلقت كلا المجموعتين تعزيزًا كبيرًا في الأداء، شهد أصحاب الأداء الأعلى في مهمة التحكم زيادة بنسبة 17% في أدائهم عندما مُنحوا إمكانية الوصول إلى الذكاء الاصطناعي، لكن أصحاب المهارات في النصف السفلي شهدوا زيادة بنسبة 43% في أدائهم. وهذا أمر منطقي إلى حد ما، كما لو كنا نفكر في نماذج الذكاء الاصطناعي
كملخصات ممتازة للمعرفة الموجودة بالفعل في المجال العام. فالاستشاري ذو المهارات العالية الذي تقترب معرفته بالفعل من هذا الحد، سوف يستفيد بشكل أقل من استخدام الذكاء الاصطناعي، مقارنة بشخص أقل معرفة في البداية. ولكن من المثير للاهتمام أن نرى أن الذكاء الاصطناعي يمكن أن يقلل من الميزة التي يتمتع بها العمال ذوو المهارات العالية مقارنة بالعمال الأقل مهارة. ومن النتائج الأخرى المثيرة للاهتمام أنه على الرغم من أن الدراسة وجدت أن الأشخاص الذين يستخدمون الذكاء الاصطناعي أنتجوا أفكارًا ذات جودة أعلى في أق
سام العصف الذهني في الدراسة، إلا أنه كان هناك انخفاض ملحوظ في تنوع الأفكار مقارنة بأولئك الذين لا يستخدمون الذكاء الاصطناعي. هذا يذكرني بشيء قرأته منذ فترة، ولم أجد مصدرًا له، حيث تم وصف نماذج الذكاء الاصطناعي الجديدة بأنها مثل كاميرات التلفزيون الموجهة نحو التلفزيون. يمكنهم تقديم نسخ جيدة من الأشياء الموجودة بالفعل، ولكن لا يمكنهم بالضرورة الوصول إلى ما هو أبعد من بيانات التدريب الخاصة بهم. وقالت دراسة هارفارد إنه على الرغم من أن GPT-4 يساعد في توليد محتوى متميز، إلا أنه قد يؤدي إلى نتائج أكثر
عمومية. حسنًا، فماذا عن "المهام خارج الحدود؟" حسنًا، في هذه التجربة، كان الهدف هو أن يقدم المشاركون توصيات استراتيجية قابلة للتنفيذ لشركة افتراضية. تم تصميم هذه التجربة خصيصًا لتكون مهمة قد يواجه الذكاء الاصطناعي صعوبة في تنفيذها إذا كان المستخدمون يقومون ببساطة بنسخ الأسئلة ولصقها كمطالبة. وكانت المهمة مرة أخرى هي نوع دراسة الجدوى التي تستخدمها مجموعة بوسطن الاستشارية في مقابلات العمل. استندت المهمة إلى دراسة حالة عمل موجودة تستخدم البيانات الموجودة في جدول بيانات، إلى جانب ملف يعرض مقابلات مع
المطلعين على الشركة. لحل المهمة بشكل صحيح، يجب على المشاركين إلقاء نظرة على البيانات الموجودة في جدول البيانات باستخدام رؤى دقيقة ولكن واضحة من المقابلات. تم تصميم بيانات جدول البيانات لتبدو شاملة، لكن ملاحظات المقابلة كشفت عن تفاصيل مهمة. سيقوم المستشار الجيد بتعديل البيانات الموجودة في جدول البيانات لتشمل الأفكار المستمدة من المقابلات. إذا لم تفعل ذلك، أو إذا لم تزن مصدري المعلومات بشكل صحيح، فسوف تصل إلى نتيجة خاطئة. هذه المرة، توصل المشاركون في المجموعة الضابطة - الذين ليس لديهم إمكانية الوص
ول إلى الذكاء الاصطناعي - إلى الاستنتاج الصحيح في حوالي 85% من الوقت، في حين كان مستخدمو الذكاء الاصطناعي على حق بنسبة 60% من الوقت، وأولئك الذين يستخدمون الذكاء الاصطناعي بعد تلقي التدريب كانوا على حق بنسبة 70%. من الوقت. في هذه الحالة، أكمل مستخدمو الذكاء الاصطناعي المهمة بشكل أسرع مرة أخرى، لكنهم توصلوا إلى الحل الخاطئ من خلال الاعتماد على أداة الذكاء الاصطناعي بدلاً من التحليل الخاص بهم. كان للمشاركين في الاختبار الحرية في تجاهل مخرجات الذكاء الاصطناعي، أو حتى استبعاد الذكاء الاصطناعي تمامًا
، لكنهم نادرًا ما فعلوا ذلك. أحد الاستنتاجات من هذا هو أنه على الرغم من أن أداء كلتا المجموعتين من مستخدمي الذكاء الاصطناعي كان ضعيفًا، إلا أن التدريب يبدو أنه أدى إلى تقليل مستوى الأداء الضعيف. ومضى الباحثون في فحص سلوك المجموعات التي أبحرت في هذه المهمة جيدًا، لمعرفة كيف اختلف سلوكها عن المجموعة التي فشلت في المهمة. ووجدوا أن المجموعات التي استخدمت أداة الذكاء الاصطناعي اتبعت بنجاح إحدى الاستراتيجيتين. وقد أطلقوا على إحدى المجموعات اسم "القنطور" نسبة إلى المخلوق الأسطوري الذي هو نصف إنسان ونصف
حصان. قامت هذه المجموعة بالتبديل بين الذكاء الاصطناعي والمهام البشرية، وتخصيص المسؤوليات بناءً على نقاط القوة والقدرات لكل كيان، وتمييز المهام الأكثر ملاءمة للتدخل البشري والتي يمكن إدارتها بكفاءة بواسطة الذكاء الاصطناعي. أما الإستراتيجية الناجحة الأخرى والتي أطلقت عليها الدراسة اسم "سلوك السايبورغ"، فلم تتضمن فقط تفويض المهام، بل تشابك جهودهم مع الذكاء الاصطناعي، وتبديل المسؤوليات على مستوى المهام الفرعية، مثل بدء جملة ليكملها الذكاء الاصطناعي أو العمل جنبًا إلى جنب مع الذكاء الاصطناعي. لذلك ت
وصل بعض المستشارين إلى كيفية استخدام هذه الأدوات بنجاح في المواقف التي تواجه فيها هذه الأدوات صعوبات. وخلصت الدراسة إلى أنه على الرغم من أن الذكاء الاصطناعي يمكن أن يعزز أداء العاملين في مجال المعرفة ذوي المهارات العالية، إلا أن أفضل الأساليب لاستخدام الذكاء الاصطناعي لم يتم فهمها بالكامل بعد وتحتاج إلى دراستها قبل تنفيذ هذه النماذج بلا مبالاة في مكان العمل. تسلط الورقة الضوء على أهمية التحقق من صحة مخرجات الذكاء الاصطناعي والتدقيق فيها، تمامًا مثلما يتحقق موظف كبير من عمل موظف جديد للتأكد من أن
ه لم يرتكب أي أخطاء واضحة. تظهر الدراسة أن أسوأ النتائج جاءت من أولئك الذين يميلون إلى تبني مخرجات الذكاء الاصطناعي بشكل أعمى دون التشكيك فيها. ومن المرجح أن تعمل هذه النماذج على تغيير الطريقة التي يعمل بها العاملون في مجال المعرفة في السنوات المقبلة، تماماً كما حدث عندما ظهرت أجهزة الكمبيوتر المكتبية على المكاتب قبل ثلاثين عاماً أو أكثر. والفرق الكبير بين الآن وذاك هو أن أصحاب العمل استثمروا بشكل كبير في تدريب الموظفين على استخدام أجهزة الكمبيوتر، في حين يتم تعلم نماذج اللغات الكبيرة في الغالب
من خلال التجربة والخطأ ، ولكن الأخطاء يمكن أن تكون محرجة للغاية. أحد الأمثلة الحديثة على التنفيذ السيئ للذكاء الاصطناعي هو الدعوى القضائية التي خسرتها شركة طيران كندا هذا الأسبوع ضد راكب حزين عندما حاولت الابتعاد عن الوعود التي قطعتها روبوت الدردشة الذي يعمل بنظام الذكاء الاصطناعي. أخبر برنامج الدردشة الآلي أحد العملاء أنه يمكنه شراء تذكرة بالسعر الكامل الآن، ثم التقدم لاحقًا للحصول على خصم الفجيعة الخاص بشركة الطيران، وهو ما لم يكن سياسة طيران كندا. كان على العميل مقاضاة شركة الطيران للحصول على
الخصم الذي يقدمه برنامج الدردشة الآلي المخطئ. من المعروف أن النماذج اللغوية الكبيرة تشكل إجابات عند طرح أسئلة صعبة أو استشهادات وهمية - مما ينتحل أسلوب الأوراق الأكاديمية - ولكنها تشير إلى أوراق مرجعية غير موجودة في الواقع. وفي دراسة حديثة أجرتها جامعة ستانفورد، وجد الباحثون أن الأسئلة المتعلقة بقضايا المحاكم الفيدرالية أدت إلى معدل خطأ مرتفع للغاية. قام ChatGPT بتلفيق الاستجابات بنسبة 69 في المائة من الوقت، في حين حقق نموذج Meta's Llama 2 معدل تلفيق بنسبة 88 في المائة. لاستخدام أدوات الذكاء ال
اصطناعي بشكل فعال في مكان العمل، نحتاج إلى فهم التكنولوجيا المتعرجة بشكل أفضل الحدود الموصوفة في هذه الدراسة، والتي ستتغير بالطبع بمرور الوقت مع تحسن النماذج. أظهرت ورقة بحثية نُشرت هذا الصيف بعنوان "التأثيرات قصيرة المدى للذكاء الاصطناعي التوليدي على التوظيف" أنه في غضون أشهر قليلة من إطلاق نماذج اللغات الكبيرة، شهد مؤلفو النصوص ومصممو الجرافيك على منصات العمل الحر عبر الإنترنت انخفاضًا كبيرًا في الرسوم التي يمكنهم فرضها وفي عدد الوظائف التي حصلوا عليها. يشير هذا إلى أن الذكاء الاصطناعي لم يكن
يحل محل عملهم فحسب، بل يقلل أيضًا من قيمة العمل الذي لا يزال بإمكانهم الحصول عليه. كان أداء المستقلين الأكثر تأهيلاً والأعلى دخلاً هو الأسوأ، مما يدل على أن كونهم من ذوي المهارات العالية لا يوفر أي حماية ضد فقدان العمل أو الأرباح لهؤلاء المستقلين. وأظهرت دراسة جامعة هارفارد تسوية مماثلة للعاملين، حيث شهد المستشارون الأقل مهارة أكبر دفعة في الأداء عندما مُنحوا إمكانية الوصول إلى أدوات الذكاء الاصطناعي، ولكن فقط في المهام التي تقع ضمن الحدود المتعرجة. وأظهر النصف الثاني من الدراسة أنه (على الأقل ا
ليوم) كلما كانت المهمة متعددة الأوجه ، كلما زاد الحكم البشري - وكانت هناك حاجة إلى خبرة حقيقية. تثير دراسة هارفارد أسئلة إضافية حول مستقبل مكان العمل. عادةً، يكتسب الموظفون المبتدئون الخبرة من خلال العمل مع كبار الموظفين ويتم تكليفهم بمهام أكثر تحديًا بشكل تدريجي. وإذا تم تفويض هذه المهام "داخل الحدود" إلى الذكاء الاصطناعي في المستقبل، بدلا من الموظفين المبتدئين، فهل يصبح من الصعب على المبتدئين تطوير الخبرة اللازمة للتعامل مع "المهام خارج الحدود" في المستقبل. إن التأثير الكبير على المهام من نوع
العصف الذهني الذي شوهد في هذه الدراسة يعني أنه سيتم استخدام الذكاء الاصطناعي لهذا النوع من المهام من الآن فصاعدا، ولكن حقيقة أن المخرجات ذات جودة عالية - ولكن ربما تكون عامة تشير إلى أن الأفكار التي يولدها الإنسان قد تبرز من بين الحشود في المستقبل بسبب تميزهم. بشكل عام، أنا لست متشائمًا تمامًا بشأن هذه الأدوات الجديدة؛ لا أعتقد أن الجهد البشري سيصبح عفا عليه الزمن في المستقبل. وقد تم تقديم حجج مماثلة في الثورة الصناعية؛ لقد تم صنعها عندما أصبحت أجهزة الكمبيوتر متاحة على نطاق واسع وعندما أدى الوص
ول إلى الإنترنت إلى جعل المعرفة متاحة للجمهور بشكل أكبر . أعتقد أن هذه الأدوات ستغير أنواع العمل الذي نقوم به، لكن لا ينبغي أن يكون ذلك أمرًا سيئًا. أود أن أسمع في قسم التعليقات إذا كنت تستخدم أدوات الذكاء الاصطناعي في العمل، أين وجدتها مفيدة وما الذي تعلمته من تجاربك؟ إذا استمتعت بهذا الفيديو، فيجب عليك مشاهدة هذا الفيديو التالي. لا تنس التحقق من الراعي الخاص بنا Magical باستخدام الرابط الموجود في الوصف. أتمنى لك يومًا رائعًا ونراكم في الفيديو التالي. الوداع.

Comments

@PBoyle

Get Magical AI for free and save 7 hours every week: https://getmagical.com/patrick

@antoinepageau8336

You can tell this channel is 100% powered by AI, the SIM presenter never blinks.

@germansnowman

My favourite quote regarding Large Language Models: “The I in LLM stands for Intelligence.”

@luckylanno

My experience matches the study. I am a senior software engineer, so I write a lot of software and write a lot of documentation about that software. Usually the AI generated code only represents the common use case, which is little better than what I could get out of the typical documentation for an open source project, for example. It's a little bit easier to use the AI as a search engine, but if the problem goes outside of the boundaries of the most common use case even a little bit, I'm on my own. Basically, it quickly writes code that I would have just copied and pasted from an example anyway, but I still have to do the hard parts myself. It's a little better for generating documentation, but typically I have to do so many edits to fix errors or get the focus or tone right, that the time savings shrinks dramatically. I'm a little worried that AI is generally only going to give a best case 50% productivity boost to most, while the market seems to be assuming a productivity revolution... I'm worried for my 401k, I mean.

@caty863

I recently wasted two days trying to diagnose and address a bug in my script thanks to the over-reliance on AI. At the end, I gave up and decided to consult the documentation of the API and scroll through user forums. I immediately got all the answers I needed. I will never think of these AI tools the same ever again.

@devonglide1830

I'm not knocking AI, I use it quite a bit. But my general feeling (based on how I use it) is that all it's done (doing) is quickly web scraped the top 10 Google pages and summarized them for me. Like I said, in my field that is very, very handy and saves me time because I don't need to skim pages and blogs to find answers. On the other hand, it's never offered an answer or solution that would make me think its done anything remotely original.

@jalliartturi

I play with AI in SEO. What’s interesting is that due to the error rate and generic content it’s actually quicker to write by hand instead of having AI do it and then fix all the mistakes it does.

@KathyClysm

I work in software marketing, and quite frankly, as excited as everyone was about the new developments in the beginning, we've essentially stopped using any "AI" or LLMs. For coding, all an LLM can give you is basically the most common code you'd find in any library anyway, and if I ask it to code something longer or more complex, LLMs tend to cause more problems then they solve: because they don't actually "understand", they have no concept of contingency or continuity, so for example they switch how they refer to a specific variable mid-code. Ultimately, for the 30min it saves me in coding from scratch or just looking it up in our documentation, I spend 50min bugfixing the LLM code. Same with user documentation - the LLM texts have no concept of terminological consistency so they keep adding synonyms to terms that have a fixed definition in our company terminology etc. And for the marketing part of it, you'd think LLMs are useful for generating those generic fluff texts you need just to fill a website, but because the output of an LLM is - per definition - the most common sequence of sentences and paragraphs from the data set the LLM was trained on, you end up with marketing fluff that is so incredibly boring, bland and lacking in any uniqueness, that it's not even useful for fluff text. The only use we've found for it so far is automated e-mail replies - which we previously handled via a run-of-the-mill productivity tool.

@Zachary-Daiquiri

Tldr: Ai helps with things it's good at and hurts with things it is bad at. The problem is that it isn't really clear what ai is good or bad at.

@SH-ly1uy

The first serious video I see on the topic. So much better than all these sales bros going “AI is going to change the world within the next 2 years. Hire me and I tell you how”

@kulls13

I work in a manufacturing shop and I've used AI to quickly create code to complete certain tasks. We don't have any developers on site obviously and some of our coding needs are fairly simple. AI has allowed me to create simple programs to complete a repetitive task without needing a programmer.

@ricks5756

Just a side note: commercially available freelance art projects are starting to become harder to find. Illustrators, concept artists, and background artists are losing a lot of paying work in my experience.

@LockFarm

Hard not to notice that the definition of a high end consultancy job requiring top students from elite universities is "Come up with an idea for a drink", and "Come up with an idea for a shoe". Yet the people who have the actual technical knowledge to make the drink, or build the shoe don't get a look in. If we compared the respective salaries, I'm willing to bet that the Apprentice extras will be earning double or more that of the people who actually do the work. So when we hear that these corporate experts might be put out of a job by AI... my sympathy is strangely absent.

@lelik0911

I appreciate the boldness of consulting firms offering predictions on the future of a nascent technology, as though they have any more insight than we do.

@Tudor_Rusan

I'm a medical translator and because I'm a fast typer I prefer translating from scratch to post-editing machine translations. Sometimes they are frighteningly smart, but it's a bit like the world's smartest two year-old. You can't rely on it, especially for sensitive documents where you need humans in the loop.

@stribika0

It's so good at adding the expected bullshit to my emails. It can come up with clearly horrible options so that management feels like they had a choice, it can pretend the good option was their idea, it can completely automate bikeshedding, etc. It's awesome.

@mwwhited

Part of my role is to examine technology to make sure my fellow develop and our clients are well informed and using the right tool. So far my personal experiments with AI show similar results to these studies. The models are okay at easy, highly repetitive and duplicative work but not very good at highly skilled/technical work. They are good at making things up or doing stuff that has been done hundreds of times in their training data but struggle with creative work and it’s nearly impossible to prevent the “hallucinations” from occurring where the models fabricate something when they don’t actually know the answer.

@Keiranful

In business development I use gpt to get me started on writing texts that will then be heavily edited, or as a research tool to point me in the direction of the information I seek.

@XYZ-ft4hw

Excellent overview. I love gpt for writing emails. Saves maybe a few hours a week. Beyond that... its easier to google or lookup source material than double check if it is accurate. The confusion is the subtlety in how models work vs what people imagine they are doing. Steven wolfram has the most intuitive technical explanation on his blog I have seen.

@WorldinRooView

The skill moat you mention at the end is my gravest concern. I've been at the job I have been for 13 years, and it's my expertise I gained over those years that make me a value to my employer. Now with outsourcing tasks, either overseas via remote work, or though AI to do the small and annoying things, you can't learn how the system works to try and push through the annoying things more quickly. This is how humans learn efficiency, and perhaps new methods not thought of by the prior generation. Over the past few years, I feel like my workplace is falling backwards more than forwards. I can't fully work with the people I'm supposed to delegate to due to the time zone difference. So it means if they don't get to an urgent task, I have to do it. Lately I'm feeling this "AI" thing is literally a salesperson selling a bag of beans hoping for some Deus Ex Machina to save us from our grudging tasks. And to sell the customers 'a solution'. But in the end the "AI" is merely office workers analyzing data with grueling deadlines, not unlike the wizard of oz just being a man behind a curtain. The humans will do the work, but the machine will get the credit.