چرا استارتآپهای هوش مصنوعی دادهها را به دست خود میگیرند
شرکتهای هوش مصنوعی به جای استفاده از دادههای وب یا برچسبگذاران کمدستمزد، اکنون به دادههای اختصاصی آموزش به عنوان مزیت رقابتی نگاه میکنند.

تحول در جمعآوری دادههای آموزش هوش مصنوعی
شرکتهای هوش مصنوعی در حال تغییر روش جمعآوری دادههای آموزش هستند. به جای استفاده از دادههای scrap شده از وب یا برچسبگذاران کمدستمزد، اکنون بر دادههای اختصاصی و باکیفیت تمرکز میکنند. شرکتهایی مانند توریگ لبز با استخدام هنرمندان، آشپزان و کارگران ساختمانی برای فیلمبرداری با دوربینهای GoPro، دادههای ویدیویی متنوعی جمعآوری میکنند. هدف آموزش مدلهای بینایی برای درک حل مسئله ترتیبی و استدلال بصری است.
- تغییر تمرکز از کمیت به کیفیت: شرکت Fyxer دریافت که کیفیت دادهها نه کمیت آنها عملکرد مدل را تعیین میکند
- استفاده از دادههای مصنوعی: توریگ لبز ۷۵-۸۰ درصد دادههایش را از طریق دادههای مصنوعی تولید میکند
- مزیت رقابتی: جمعآوری داخلی دادهها به عنوان یک سد رقابتی قدرتمند عمل میکند
- چالشهای فیزیکی: فیلمبرداری طولانی با دوربینهای روی پیشانی باعث سردرد و ناراحتی میشود
- نیاز به متخصصان: Fyxer از دستیاران اجرایی باتجربه برای آموزش مدلهای ایمیل استفاده کرد
“ما دریافتیم که کیفیت دادهها، نه کمیت آنها، چیزی است که واقعاً عملکرد را تعریف میکند” - ریچارد هالینگزورث “اگر دادههای پیشآموزش خود از کیفیت خوبی برخوردار نباشند، هر کاری که با دادههای مصنوعی انجام دهید نیز از کیفیت خوبی برخوردار نخواهد بود” - سودارشان سیوارامان
این رویکرد جدید نشان میدهد که شرکتهای هوش مصنوعی به اهمیت دادههای باکیفیت و اختصاصی به عنوان کلید موفقیت در رقابت پی بردهاند.
