در این گزارش خبری در کارینا وب، به بررسی یک موضوع داغ در دنیای فناوری میپردازیم: آیا دستیارهای کدنویسی هوش مصنوعی واقعاً کارایی برنامهنویسان را افزایش میدهند؟ برای مدتها، تصور عمومی بر این بود که بله، هوش مصنوعی مولد در هیچ زمینهای به اندازه کدنویسی موفق عمل نکرده است. همین باور بود که شرکتهایی مانند OpenAI و Google را به رقابت برای جذب استارتآپهای فعال در این حوزه واداشت. اما اکنون، پژوهشهای جدید این فرض را به چالش کشیدهاند.
دستیارهای هوش مصنوعی، کندتر از آنچه تصور میکنیم؟
هفته گذشته، METR، یک سازمان غیرانتفاعی که مدلهای هوش مصنوعی را ارزیابی میکند، نتایج یک آزمایش کنترلشده را منتشر کرد. در این آزمایش، ۱۶ برنامهنویس با تجربه از دستیار کدنویسی Cursor Pro که با مدلهای هوش مصنوعی Claude Sonnet 3.5 و 3.7 یکپارچه شده بود، استفاده کردند. پیش از شروع، برنامهنویسان پیشبینی کردند که این ابزار به طور متوسط ۲۴% سرعت آنها را افزایش میدهد و پس از اتمام آزمایش این تخمین را به ۲۰% کاهش دادند. اما نتایج واقعی خیرهکننده بود. METR دریافت که کدنویسانی که از دستیار هوش مصنوعی استفاده کرده بودند، در واقع ۱۹% زمان بیشتری برای تکمیل وظایف خود صرف کردند.
چرا این اتفاق افتاد؟ این تحقیق نشان داد که دستیار هوش مصنوعی در پروژههای پیچیده و بزرگ، کدها را با کیفیتی پایینتر از انتظار تولید میکرد و برنامهنویسان تنها کمتر از ۴۴% از پاسخهای پیشنهادی را پذیرفتند. علاوه بر این، بسیاری از آنها احساس میکردند که باید خط به خط کد تولید شده توسط هوش مصنوعی را بررسی کنند تا از دقت آن مطمئن شوند و بیش از نیمی از آنها تغییرات اساسی در آن ایجاد میکردند. این فرآیند بررسی و اصلاح، به طور متوسط ۹% از زمان کاری آنها را به خود اختصاص میداد. برنامهنویسان در این آزمایش متوجه شدند که در پروژههای بزرگ با دهها هزار خط کد، دستیار هوش مصنوعی گاهی اوقات در بخشهای دیگر کد تغییرات عجیبی ایجاد میکرد که باید آنها را پیدا و اصلاح میکردند.
چرا برنامهنویسان با وجود کاهش سرعت، از هوش مصنوعی استفاده میکنند؟
با وجود نتایج این تحقیق، METR دریافت که ۶۹% از برنامهنویسان شرکتکننده تمایل داشتند به استفاده از Cursor ادامه دهند. پاسخ به این سوال شاید در یک مزیت غیرمنتظره نهفته باشد: کاهش بار شناختی. بسیاری از برنامهنویسان اذعان کردند که اصلاح کدهای تولید شده توسط هوش مصنوعی از نظر ذهنی آسانتر از نوشتن کد از ابتداست، حتی اگر از نظر زمانی به صرفه نباشد. این پدیده “کدنویسی حسی” (vibe coding) فقط به دنیای برنامهنویسی محدود نمیشود. گزارشهایی از وکلا نیز وجود دارد که ابزارهای هوش مصنوعی در تحقیقات حقوقی به آنها حس رضایت بیشتری میدهند، حتی اگر زمان زیادی برای بررسی دقیق نتایج آنها صرف شود.
آیا راه حل در رویکرد متفاوت است؟
نقطه امیدبخش: رویکرد متفاوت در همین حال، دو تحقیق دیگر رویکردهای متفاوتی را ارائه میدهند. یک مطالعه مشترک از دانشکده کسبوکار هاروارد و Microsoft بر روی GitHub Copilot نشان داد که برنامهنویسان با استفاده از این ابزار، زمان بیشتری را صرف کارهای کدنویسی و زمان کمتری را صرف وظایف مدیریت پروژه میکنند. این ابزار به آنها امکان میدهد تا به طور مستقلتر کار کرده و زمان بیشتری را به کاوش راهحلهای احتمالی اختصاص دهند. همچنین، محققانی از یک استارتآپ چینی و چندین دانشگاه، معماری جدیدی به نام “ChatDev” را معرفی کردند. در این روش، به جای استفاده از یک دستیار، چندین مدل زبان بزرگ (LLM) برای انجام وظایف خاص در فرآیند توسعه نرمافزار به کار گرفته میشوند. این مدلها به طور متقابل از یکدیگر سوالات شفافکننده میپرسند تا خطاها را به حداقل برسانند. نتایج این رویکرد به طور قابل توجهی بهبود یافت و نشان داد که شاید مشکل از نحوه استفاده ما از این ابزارها باشد، نه خود فناوری.
در نهایت، شاید این پرسش مطرح شود که آیا سودمندی هوش مصنوعی در کدنویسی یک سراب است؟ شاید پاسخ این باشد که این مزایا واقعی هستند، اما به شرطی که از این فناوری به عنوان یک دستیار هوشمند و مکمل استفاده شود، نه جایگزین تفکر و تخصص انسانی. این ابزارها میتوانند با خودکارسازی کارهای تکراری و کاهش بار ذهنی، به برنامهنویسان کمک کنند تا بر جنبههای خلاقانه و پیچیدهتر کار خود متمرکز شوند.
منبع: finance.yahoo.com