تطبیق دامنه عمیق در بینایی رایانه ای

تطبیق دامنه عمیق در بینایی رایانه ای

در دهه گذشته ، زمینه بینایی کامپیوتر پیشرفت بزرگی داشته است. این پیشرفت بیشتر ناشی از اثربخشی غیرقابل انکار شبکه های عصبی کانولوشنال (CNN) است. در صورت آموزش با داده های آموزشی حاشیه نویسی با کیفیت بالا ، CNN ها می توانند پیش بینی های بسیار دقیقی داشته باشند. به عنوان مثال ، در یک طبقه بندی ، اغلب از یکی از معماری های استاندارد شبکه (ResNet ، VGG و غیره) استفاده می کنید و آن را با استفاده از مجموعه داده خود آموزش می دهید. این به احتمال زیاد منجر به عملکرد بسیار خوبی می شود.

از طرف دیگر ، اگر مجموعه داده های بزرگ حاشیه نویسی دستی برای مشکل خاص خود را در اختیار ندارید ، CNN ها همچنین امکان استفاده از دیگران را که قبلاً آموزش دیده اند ، می دهند. برای انتقال مشکل مشابه با انتقال یادگیری. در این صورت ، شما باید از شبکه ای استفاده کنید که از قبل روی یک مجموعه داده بزرگ آماده شده است و برخی از لایه های بالایی آن را با استفاده از مجموعه داده حاشیه ای کوچک خود تنظیم کنید.

هر دوی این رویکردها فرض می کنند که داده های آموزشی شما (چه بزرگ باشد) یا کوچک) نماینده توزیع اساسی است. با این حال ، اگر ورودی ها در زمان آزمایش به طور قابل توجهی با داده های آموزش متفاوت باشد ، ممکن است مدل چندان خوب عمل نکند. برای مثال ، فرض کنیم که شما یک مهندس خودروهای مستقل هستید و می خواهید تصاویر گرفته شده توسط دوربین خودرو را تقسیم بندی کنید تا بدانید چه چیزی در پیش است (ساختمانها ، درختان ، ماشینهای دیگر ، عابران پیاده ، چراغ راهنمایی و غیره). شما حاشیه نویسی های خوبی را برای مجموعه داده NYC خود ایجاد کرده اید و با استفاده از این یادداشت ها یک شبکه بزرگ را آموزش می دهید. شما اتومبیل خودران خود را در خیابان های منهتن آزمایش می کنید و به نظر می رسد همه چیز خوب کار می کند. سپس همان سیستم را در پاریس آزمایش می کنید و ناگهان همه چیز بسیار اشتباه پیش می رود. ماشین دیگر قادر به تشخیص چراغ راهنما نیست ، ظاهر خودروها بسیار متفاوت است (کابین زرد در پاریس وجود ندارد) و خیابان ها دیگر به این شکل صاف نیستند.

دلیل عملکرد خوب مدل شما در این سناریوها این است که حوزه مشکل تغییر کرده است. در این مورد خاص ، دامنه داده های ورودی تغییر می کند در حالی که دامنه وظیفه (برچسب ها) ثابت می ماند. در موارد دیگر ، ممکن است بخواهید از داده های یک دامنه (برای همان توزیع اصلی تهیه شده) برای انجام یک کار جدید استفاده کنید. به طور مشابه ، حوزه های ورودی و وظیفه می توانند به طور همزمان متفاوت باشند. در این موارد ، سازگاری دامنه به نجات شما می آید. انطباق دامنه یک زیر شاخه از یادگیری ماشین است که با سناریوهایی سروکار دارد که در آن از یک مدل آموزش داده شده در توزیع منبع در زمینه توزیع هدف متفاوت (اما مرتبط) استفاده می شود. به طور کلی ، تطبیق دامنه از داده های برچسب زده شده در یک یا چند دامنه منبع برای حل کارهای جدید در یک دامنه هدف استفاده می کند. سطح ارتباط بین حوزه منبع و هدف معمولاً تعیین می کند که سازگاری چقدر موفق خواهد بود.

روشهای متعددی برای سازگاری دامنه وجود دارد. در سازگاری دامنه "کم عمق" (نه عمیق) ، معمولاً از دو روش استفاده می شود: توزین مجدد نمونه های منبع و آموزش بر روی نمونه های وزن شده و تلاش برای یادگیری یک فضای مشترک برای مطابقت با توزیع منبعو مجموعه داده های هدف در حالی که این تکنیک ها ممکن است در زمینه یادگیری عمیق نیز کاربرد داشته باشند ، ویژگیهای عمیق آموخته شده توسط شبکه های عصبی عمیق (DNNs) معمولاً باعث ایجاد نمایش های قابل انتقال بیشتر می شود (به طور کلی یادگیری ویژگی های بسیار قابل انتقال در لایه های پایین تر در حالی که قابلیت انتقال در لایه های بالاتر به شدت کاهش می یابد. ، به عنوان مثال به این مقاله توسط Donahue و همکاران مراجعه کنید). در Deep Domain Adaptation ، ما سعی می کنیم از این ویژگی DNN ها استفاده کنیم.

دسته بندی های اقتباس دامنه

خلاصه زیر بیشتر بر اساس این مقاله مروری توسط Wang و همکاران و این بررسی توسط ویلسون و همکاران در آن کار ، نویسندگان بسته به پیچیدگی کار ، میزان داده های برچسب دار/بدون برچسب و تفاوت در فضای ویژگی ورودی ، بین انواع مختلف تطبیق دامنه تمایز قائل می شوند. آنها به طور خاص تطبیق دامنه را مشکلی تعریف می کنند که در آن فضای کار یکسان است و تفاوت تنها در واگرایی حوزه ورودی است. بر اساس این تعریف ، سازگاری دامنه می تواند همگن باشد (فضاهای ویژگی ورودی یکسان هستند ، اما توزیع داده های متفاوتی دارند) یا ناهمگن (ممکن است فضاهای ویژگی و ابعاد آنها متفاوت باشد).

تطبیق دامنه نیز ممکن است در یک مرحله (سازگاری دامنه یک مرحله ای) یا طی چندین مرحله ، طی یک یا چند دامنه در فرآیند (سازگاری دامنه چند مرحله ای) رخ می دهد. در این پست ، ما فقط در مورد سازگاری دامنه یک مرحله ای بحث می کنیم ، زیرا این رایج ترین نوع سازگاری دامنه است.

بسته به داده هایی که از دامنه مورد نظر در دسترس دارید ، می توان تطبیق دامنه را بیشتر طبقه بندی کرد تحت نظارت (شما داده هایی از حوزه مورد نظر برچسب گذاری کرده اید ، هرچند که مقدار آن برای آموزش یک مدل بسیار کم است) ، نیمه نظارت (شما داده های برچسب دار و بدون برچسب دارید) و بدون نظارت (هیچ گونه اطلاعات برچسب گذاری ندارید) از حوزه مورد نظر). به نظر می رسد که پاسخ به این س isال آسان نیست و ارتباط با وظایف هنوز یک موضوع تحقیق فعال است. اگر از دو ویژگی برای تصمیم گیری استفاده کنند ، می توانیم دو کار را شبیه هم تعریف کنیم. احتمال دیگر این است که اگر دو بردار پارامتر آنها (یعنی مرزهای طبقه بندی) نزدیک باشند ، دو وظیفه را شبیه هم تعریف کنیم (به مقاله Xue و همکاران مراجعه کنید). از سوی دیگر ، بن دیوید و همکاران. اگر داده های هر دو وظیفه را می توان از یک توزیع احتمال ثابت با استفاده از مجموعه ای از تحولات ایجاد کرد ، دو وظیفه با F مرتبط هستند: با مجموعه داده های خود سازگار باشید تا ببینید آیا می توانید با استفاده از یک مدل از وظیفه منبع ، برای کار مورد نظر خود فایده ای کسب کنید. اغلب ، ارتباط با وظیفه را می توان با استدلال ساده ، مانند تصاویر از زاویه دید متفاوت یا شرایط مختلف نور ، یا در زمینه پزشکی ، تصاویر از دستگاه های مختلف و غیره تعیین کرد.

تکنیک ها و برنامه های کاربردی برای یک نفر -استفاده از دامنه گام

سه تکنیک اساسی برای انطباق دامنه یک مرحله ای وجود دارد: مدل ها (GANs) یا با استفاده از از دست دادن اختلال در دامنه ، و مبتنی بر بازسازیتطبیق دامنه با استفاده از رمزگذارهای خودکار (SAEs) یا GAN ها.

اقتباس دامنه مبتنی بر واگرایی

تطبیق دامنه مبتنی بر واگرایی با به حداقل رساندن برخی معیارهای واگرایی بین توزیع داده منبع و هدف ، کار می کند. دستیابی به نمایشی از ویژگی های تغییر ناپذیر دامنه. اگر چنین نمایشی از ویژگی ها را بیابیم ، طبقه بندی کننده می تواند در هر دو دامنه به همان اندازه خوب عمل کند. البته این فرض بر این است که چنین نمایشی وجود دارد که به نوبه خود فرض می کند که وظایف به نحوی مرتبط هستند. مغایرت دامنه متضاد (CCD) و معیار Wasserstein.

MMD یک آزمون فرضیه است که با مقایسه میانگین ویژگیها پس از نگاشت آنها به یک هسته بازسازی کننده هیلبرت فضایی ، آزمایش می کند که آیا دو نمونه از توزیع یکسان هستند یا خیر. RKHS). اگر وسایل متفاوت باشند ، توزیع نیز احتمالاً متفاوت است. این امر اغلب با استفاده از ترفند جاسازی هسته و مقایسه نمونه ها با استفاده از هسته گاوس انجام می شود. در اینجا شهود این است که اگر دو توزیع یکسان باشند ، میانگین (میانگین) شباهت بین نمونه ها از هر توزیع باید برابر با میانگین شباهت بین نمونه های مخلوط از هر دو توزیع باشد. مثالی برای استفاده از MMD در تطبیق دامنه ، این مقاله توسط روزانتسف و همکاران است. در این مقاله ، از معماری دو جریان با وزنهایی که مشترک نیستند اما با استفاده از ترکیبی از طبقه بندی ، منظم سازی و از دست دادن مغایرت دامنه (MMD) مانند شکل زیر استفاده می شود ، استفاده می شود.

< img src = "https://cdn-images-1.medium.com/max/426/1*lJR3iiBGWcxOguHWUUiA7w.png"> معماری دو جریان توسط روزانتسف و همکاران

بدین ترتیب ، تنظیمات ممکن است تحت نظارت ، نیمه نظارت یا حتی بدون نظارت (بدون طبقه بندی در حوزه مورد نظر).

CORAL (پیوند) مشابه MMD است ، با این حال سعی می کند آمار مرتبه دوم (همبستگی) از توزیع های منبع و هدف به جای استفاده از تبدیل خطی. این مقاله توسط سان و همکاران از CORAL در زمینه یادگیری عمیق با ایجاد یک ضرر CORAL متمایز با استفاده از هنجار Frobenius بین ماتریس های کوواریانس منبع و هدف استفاده می کند.

CCD نیز بر اساس MMD است ، اما همچنین از توزیع برچسب با نگاه به شرطی استفاده می کند. توزیع ها این امر باعث می شود که ویژگی های دامنه مشترک همچنان پیش بینی را در برچسب ها حفظ کنند. به حداقل رساندن CCD اختلاف بین طبقه ای را به حداقل می رساند در حالی که اختلاف بین طبقه ای را به حداکثر می رساند. این کار به برچسب های دامنه منبع و هدف نیاز دارد. برای رهایی از این محدودیت ، کانگ و همکاران. پیشنهاد می کند که برچسب های هدف از دست رفته را با استفاده از خوشه بندی در یک روش تکراری تخمین بزنید که به طور مشترک برچسب های هدف و نمایش ویژگی ها را بهینه می کند. بر این اساس ، برچسب های هدف با خوشه بندی یافت می شوند ، که بر اساس آن CCD برای تطبیق ویژگی ها به حداقل می رسد. فاصله Wasserstein این در DeepJDOT (Damodaran و همکاران) پیشنهاد شده است. نویسندگان پیشنهاد می کنند تا اختلافات بین نمای اصلی ویژگی های مشترک و برچسب ها را از طریق انتقال بهینه به حداقل برسانید.

اقتباس دامنه مبتنی بر خصومت

این تکنیک سعی می کند با استفاده از آموزش های متقابل به سازگاری دامنه برسد. < /p>

یک رویکرد ایجاد داده های هدف مصنوعی است که به نوعی با دامنه منبع (به عنوان مثال با حفظ برچسب ها) با استفاده از Generative مرتبط است.شبکه های متخاصم (GAN). سپس از این داده های ترکیبی برای آموزش مدل هدف استفاده می شود.

مدل CoGAN سعی می کند با استفاده از دو جفت مولد/تشخیص دهنده برای توزیع منبع و هدف به این مهم دست یابد. برخی از وزنه های ژنراتورها و تشخیص دهنده برای یادگیری یک فضای ویژگی متغیر دامنه تقسیم می شوند. به این ترتیب ، داده های برچسب زده می توانند تولید شوند که می توانند بیشتر در کارهایی مانند طبقه بندی استفاده شوند.

معماری CoGAN توسط لیو و همکاران

در نصب دیگری ، یو و همکاران. سعی کنید یک شبکه مبدل منبع/هدف را با استفاده از دو تشخیص دهنده یاد بگیرید: یکی برای اطمینان از واقعی بودن داده های هدف ، و دیگری برای حفظ ارتباط بین حوزه منبع و هدف. بدین ترتیب ژنراتور به داده های منبع مشروط می شود. این رویکرد فقط به داده های بدون برچسب در حوزه مورد نظر نیاز دارد.

اگر علاوه بر ضرر طبقه بندی مورد استفاده ، از به اصطلاح از دست دادن اختلال در دامنه استفاده کنیم ، می توانیم ژنراتورها را به کلی از بین ببریم و به طور یکجا اقتباس دامنه را انجام دهیم. برای وظیفه فعلی از دست دادن سردرگمی دامنه مشابه تبعیض در GAN ها است زیرا سعی می کند توزیع های منبع و دامنه های هدف را مطابقت دهد تا لایه های طبقه بندی سطح بالا را "اشتباه" بگیرد. شاید مشهورترین نمونه چنین شبکه ای ، شبکه عصبی دامنه ای (DANN) توسط Ganin و همکاران باشد. این شبکه شامل دو ضرر است ، از دست دادن طبقه بندی و از دست دادن سردرگمی دامنه. این شامل یک لایه معکوس گرادیان است تا با توزیع ویژگی ها مطابقت داشته باشد. با به حداقل رساندن از دست دادن طبقه بندی برای نمونه های منبع و از دست دادن سردرگمی دامنه برای همه نمونه ها (در حالی که از دست دادن اختلال در دامنه برای استخراج ویژگی) ، این امر باعث می شود که نمونه ها برای طبقه بندی کننده متقابلاً غیرقابل تشخیص باشند.

معماری شبکه عصبی دامنه ای-خصمانه توسط گانین و همکاران.

بازسازی دامنه مبتنی بر بازسازی

این رویکرد از یک کار بازسازی کمکی برای ایجاد یک نمای مشترک برای هر یک از حوزه ها استفاده می کند. به عنوان مثال ، شبکه طبقه بندی بازسازی عمیق (DRCN) سعی می کند این دو وظیفه را به طور همزمان حل کند: (1) طبقه بندی داده های منبع و (2) بازسازی داده های هدف بدون برچسب. این اطمینان می دهد که شبکه یاد می گیرد نه تنها به درستی تبعیض قائل شود ، بلکه اطلاعات مربوط به داده های مورد نظر را نیز حفظ می کند. در مقاله نویسندگان همچنین اشاره می کنند که خط لوله بازسازی یاد می گیرد که تصاویر منبع را به تصاویری شبیه مجموعه داده مورد نظر تبدیل کند ، و این نشان می دهد که نمایش مشترکی برای هر دو یاد گرفته شده است.

معماری DRCN توسط Ghifary et al.

امکان دیگر استفاده از GAN های چرخه ای است. Cycle GAN ها از مفهوم یادگیری دوگانه در ترجمه ماشین الهام گرفته اند. این مفهوم به طور همزمان دو مترجم زبان مخالف (A-B، B-A) آموزش می دهد. سیگنالهای بازخورد در حلقه شامل مدلهای زبان مربوطه و نمرات متقابل BLEU است. همین کار را می توان با استفاده از چارچوب im2im انجام داد. در این مقاله ، نگاشت از یک حوزه تصویر به حوزه دیگر بدون استفاده از نمونه های تصویر جفت شده آموخته می شود. این امر با آموزش همزمان دو GAN که به ترتیب تصاویر را در دو حوزه ایجاد می کنند ، انجام می شود. برای اطمینان از سازگاری ، از دست دادن قوام چرخه معرفی می شود. این مطمئن می شودکه تبدیل از یک دامنه به حوزه دیگر و دوباره منجر به یک تصویر تقریباً مشابه ورودی می شود. بنابراین ، از دست دادن کامل دو شبکه جفت شده مجموع تلفات GAN هر دو تشخیص دهنده و از دست دادن ثبات چرخه است. روی تصویر از یک دامنه دیگر در مقاله ایزولا و همکاران ، GAN های شرطی برای ترجمه تصاویر از یک حوزه به حوزه دیگر با شرط بندی تشخیص و خروجی ژنراتور در ورودی استفاده می شوند. این را می توان با استفاده از معماری رمزگشایی-رمزگشایی ساده یا جایگزینی با استفاده از معماری U-Net با اتصالات پرش به دست آورد.

چندین نتیجه از GAN مشروط توسط Isola و همکاران.

نتیجه گیری

تطبیق دامنه عمیق به ما امکان می دهد دانش آموخته شده توسط DNN خاص را در منبع وظیفه به یک وظیفه هدف جدید مرتبط در کارهایی مانند طبقه بندی تصویر یا انتقال سبک با موفقیت مورد استفاده قرار گرفته است. به نوعی ، تطبیق دامنه عمیق ما را قادر می سازد تا از نظر میزان داده های آموزشی مورد نیاز برای یک کار جدید بینایی رایانه ای ، به عملکرد سطح انسان نزدیکتر شویم. بنابراین ، من فکر می کنم که پیشرفت در این زمینه برای کل حوزه بینایی کامپیوتر بسیار مهم خواهد بود و امیدوارم در نهایت ما را به استفاده مجدد از دانش م effectiveثر و ساده در کارهای بصری سوق دهد.

به این ترتیب رایانه همسایگان خود را هک کردم

به این ترتیب رایانه همسایگان خود را هک کردم

نه تنها وب سایت ها و شرکت ها هک می شوند ، یک داستان واقعی

عکس توسط Ludovic Toinel در Unsplash سلب مسئولیت: این شخصی است که من در حال حاضر با او دوست هستم و مطمئناً این یک آموزش نیست ، به همین دلیل است که قسمت ها گم شده اند!

معرفی

به دلایل عجیب و غریبی ، من فکر کردم همسایه من مامور سرویس مخفی ، سیا یا موارد مشابه است. نحوه حرکت ، صحبت و رفتار او فقط این احساس را در من ایجاد کرد. یک شب پس از دیدن او به گاراژش و ساعت ها ماندن در آنجا ، فهمیدم چیز عجیبی در جریان است. برای اثبات ادعاهایم به شواهدی نیاز دارم و تنها چیزی که به ذهنم رسید ورود به شبکه خانگی او بود.

راه اندازی

من کامپیوترم را آتش زدم مجموعه سی دی سیستم عامل من را نصب کرده و لینوکس کالی را نصب کرده ام. همه چیز برای شروع ماجراجویی اماده و آماده بود. ناگهان متوجه شدم که شرکت اینترنتی من دچار خاموشی شده است. حالا چی؟ خوب ، من نیاز به اتصال اینترنت به مطالب گوگل و تجزیه و تحلیل اطلاعات داده شده داشتم.

دسترسی به شبکه بی سیم

از آنجا که اینترنت نداشتم و هدف اصلی من این بود که او را مجبور کنم ، اولین قدم من تلاش برای هک کردن Wi-Fi خانه او بود. به محض شروع به جمع آوری اطلاعات ، متوجه شدم روتر او از حفاظت WEP استفاده می کند ، چه؟

WEP WEP (حریم خصوصی معادل سیم) یک الگوریتم امنیتی برای IEEE 802. با هدف غلبه بر مسائل محرمانه بودن داده ها با اتصال سیمی سنتی توسعه یافته است. با رمزگذاری داده های منتقل شده برای جلوگیری از استراق سمع ، حفاظت بهتری از داده ها انجام می شود.

>

احراز هویت WEP با دو روش کار می کند: شبکه و همچنین دریافت فایل هایی که رمزگذاری نشده اند تأیید کلید کلید مشترک (SKA) - SKA به رایانه مجهز به مودم بی سیم اجازه می دهد تا به شبکه WEP دسترسی کامل داشته باشد و داده های رمزگذاری شده و رمزنگاری شده را مبادله کند.

رمزگذاری WEP را می توان با استفاده از برخی از ابزارهای ساده مانند aircrackng ، که از قبل در لینوکس کالی نصب شده است ، به راحتی هک کرد. این یک سیستم رمزگذاری است که امروزه کاملاً خراب شده است. با استفاده از این تکنیک و 1 ساعت یا بیشتر ، متوجه شدم گذرواژه وای فای او maria123456789 است

بینایی کامپیوتری توسط اندرو نگ - 11 درس آموخته

بینایی کامپیوتری توسط اندرو نگ - 11 درس آموخته

من اخیراً دوره بینایی رایانه اندرو نگ را در Coursera به پایان رساندم. Ng در توضیح بسیاری از ایده های پیچیده مورد نیاز برای بهینه سازی هرگونه کار بینایی رایانه ، کار بسیار خوبی انجام می دهد. جزء مورد علاقه من در این دوره ، انتقال سبک عصبی بود (به درس 11 مراجعه کنید) ، که به شما امکان می دهد آثار هنری ایجاد کنید که سبک کلود مونه را با محتوای هر تصویر که می خواهید ترکیب کند. این نمونه ای از کارهایی است که می توانید انجام دهید:

در این مقاله ، من 11 درس کلیدی که در این دوره آموختم را مورد بحث قرار خواهم داد. توجه داشته باشید که این چهارمین دوره تخصصی Deep Learning است که توسط deeplearning.ai منتشر شده است. اگر می خواهید در مورد 3 دوره قبلی اطلاعات کسب کنید ، توصیه می کنم این وبلاگ را بررسی کنید.

درس 1: چرا بینایی کامپیوتر در حال پیشرفت است؟

داده های بزرگ و پیشرفت های الگوریتمی باعث می شود خطای آزمایش سیستم های هوشمند به خطای بهینه بیز همگرا شود. این امر باعث می شود هوش مصنوعی در همه زمینه ها ، از جمله وظایف ادراک طبیعی ، از سطح انسانی فراتر رود. نرم افزار منبع باز TensorFlow به شما امکان می دهد از آموزش انتقال برای پیاده سازی سریع سیستم تشخیص شی برای هر شیء استفاده کنید. با یادگیری انتقال ، شما فقط به 100 تا 500 مثال نیاز دارید تا سیستم نسبتاً خوب کار کند. برچسب گذاری دستی 100 نمونه کار چندان زیادی نیست ، بنابراین شما سریعاً حداقل محصول قابل استفاده را خواهید داشت.

درس 2: چگونه عمل می کند؟

Ng نحوه پیاده سازی را توضیح می دهد عملگر convolution و نشان می دهد که چگونه می تواند لبه های یک تصویر را تشخیص دهد. او فیلترهای دیگر مانند فیلتر Sobel را که بر پیکسل های مرکزی لبه وزن بیشتری می گذارند توضیح می دهد. Ng سپس توضیح می دهد که وزن فیلتر را نباید با دست طراحی کرد بلکه باید با استفاده از الگوریتم صعود از تپه مانند شیب نزولی یاد گرفت.

درس 3: چرا پیچیدگی ها؟

Ng دلایل فلسفی متعددی ارائه می دهد که چرا پیچیدگی ها در کارهای تشخیص تصویر بسیار خوب عمل می کنند. وی 2 دلیل مشخص را بیان می کند. اولین مورد به عنوان اشتراک پارامتر شناخته می شود. این ایده وجود دارد که یک آشکارساز ویژگی که در قسمتی از تصویر مفید است احتمالاً در قسمت دیگری از تصویر مفید است. به عنوان مثال ، آشکارساز لبه احتمالاً در بسیاری از قسمت های تصویر مفید است. به اشتراک گذاری پارامترها اجازه می دهد تا تعداد پارامترها کوچک باشد و همچنین امکان تغییر ناپذیری ترجمه قوی را فراهم می آورد. تغییر ناپذیری ترجمه این تصور است که گربه جابجا شده و می چرخد ​​هنوز تصویری از گربه است. این ایده این است که هر لایه خروجی فقط تابعی از تعداد کمی ورودی است (به ویژه اندازه فیلتر در مربع). این امر تعداد پارامترهای موجود در شبکه را تا حد زیادی کاهش می دهد و امکان آموزش سریعتر را فراهم می آورد.

درس 3: چرا پدینگ؟

از پدینگ معمولاً برای حفظ اندازه ورودی (یعنی ابعاد ورودی و خروجی یکسان است) همچنین از آن استفاده می شود تا فریم های نزدیک به لبه های تصویر به اندازه فریم های نزدیک مرکز به خروجی کمک کنند.

درس 4: چرا حداکثر جمع آوری؟

از طریق تجربیتحقیقات نشان داده است که حداکثر ترکیب در شبکه های CNN بسیار مثر است. با نمونه برداری کوچک از تصویر ، تعداد پارامترها را کاهش می دهیم که باعث تغییر ویژگی ها در مقیاس یا تغییرات جهت می شود.

درس 5: معماری شبکه های کلاسیک

Ng 3 معماری شبکه کلاسیک از جمله LeNet را نشان می دهد. -5 ، AlexNet و VGG-16. ایده اصلی او این است که شبکه های م oftenثر اغلب دارای لایه هایی با اندازه کانال افزایش و کاهش عرض و ارتفاع هستند.

درس 6: چرا ResNets کار می کند؟

برای یک شبکه ساده ، خطای تمرین به صورت یکنواخت کاهش نمی یابد زیرا تعداد لایه ها به دلیل ناپدید شدن و انفجار شیب افزایش می یابد. این شبکه ها دارای اتصالات رد شده ای هستند که به شما امکان می دهد شبکه های بسیار بزرگ را بدون افت عملکرد آموزش دهید.

درس 7: از آموزش انتقال استفاده کنید!

آموزش شبکه های بزرگ ، مانند شروع ، از ابتدا می تواند در GPU چند هفته طول بکشد. شما باید وزنه ها را از یک شبکه از پیش آماده شده بارگیری کرده و فقط آخرین لایه softmax (یا چند لایه آخر) را مجددا آموزش دهید. این امر زمان تمرین را تا حد زیادی کاهش می دهد. دلیل این کار این است که لایه های قبلی تمایل دارند در همه تصاویر مانند لبه ها و خطوط منحنی با مفاهیم مرتبط باشند.

درس 8: نحوه برنده شدن در مسابقات بینایی رایانه

Ng توضیح می دهد که شما باید چندین شبکه را به طور مستقل آموزش دهید و خروجی آنها را متوسط ​​کنید تا عملکرد بهتری داشته باشید. تکنیک های افزایش داده مانند برداشتن تصادفی تصاویر ، چرخاندن تصاویر در مورد محورهای افقی و عمودی نیز ممکن است به عملکرد کمک کند. در نهایت ، برای شروع و سپس تنظیم دقیق پارامترها برای برنامه خاص خود ، باید از پیاده سازی منبع باز و مدل از پیش استفاده شده استفاده کنید.

درس 9: نحوه پیاده سازی تشخیص شی

شروع به کار Ng با توضیح ایده تشخیص نقطه عطف در یک تصویر. اساساً ، این نشانه ها از نمونه های خروجی آموزش شما جدا می شوند. با برخی از دستکاری های پیچیده پیچیدگی ، یک حجم خروجی دریافت می کنید که به شما احتمال می دهد که جسم در یک منطقه خاص و محل جسم قرار دارد. او همچنین نحوه ارزیابی اثربخشی الگوریتم تشخیص شی با استفاده از فرمول تقاطع روی اتحاد را توضیح می دهد. سرانجام ، Ng همه این اجزا را برای توضیح الگوریتم معروف YOLO کنار هم قرار می دهد.

درس 10: نحوه پیاده سازی تشخیص چهره

تشخیص صورت یک مشکل یادگیری یک مرحله ای است ، زیرا شما فقط ممکن است یک تصویر مثال برای شناسایی شخص داشته باشید. راه حل این است که یک تابع شباهت را یاد بگیرید که میزان تفاوت بین دو تصویر را نشان می دهد. بنابراین اگر تصاویر مربوط به یک شخص هستند ، می خواهید تابع تعداد کمی را تولید کند و برعکس برای افراد مختلف. ایده این است که دو شخص را جداگانه وارد یک شبکه کنید و سپس خروجی های آنها را مقایسه کنید. اگر خروجی ها مشابه باشند ، احتمالاً افراد یکسان هستند. شبکه به گونه ای آموزش دیده است که اگر دو تصویر ورودی از یک شخص باشند ، فاصله بین رمزگذاری آنها نسبتاً کم است. ایده این است که شما سه تصویر (Anchor (A) ، Positive (P) و Negative (N)) داشته باشید و شبکه را طوری آموزش دهید که فاصله خروجی بینA و P بسیار کوچکتر از فاصله بین A و N است.

درس 11: نحوه ایجاد آثار هنری با استفاده از سیستم عصبی Style Transfer

Ng نحوه ایجاد تصویر با ترکیب محتوا و سبک را توضیح می دهد. نمونه های زیر را مشاهده کنید.

کلید عصبی Style Transfer به منظور درک بازنمایی های بصری برای هر چیزی است که هر لایه در یک شبکه متحرک در حال یادگیری است. به نظر می رسد لایه های قبلی ویژگی های ساده مانند لبه ها و ویژگی های بعدی اشیاء پیچیده مانند صورت ، پا و ماشین را یاد می گیرند.

برای ایجاد یک تصویر انتقال سبک عصبی ، شما به سادگی یک تابع هزینه تعریف می کنید که ترکیبی محدب است شباهت در محتوا و سبک. به طور خاص ، تابع هزینه عبارت است از: تصویر ، C تصویر محتوا و S تصویر سبک است. الگوریتم یادگیری به سادگی از نزول گرادیان استفاده می کند تا تابع هزینه را نسبت به تصویر ایجاد شده به حداقل برساند. G.

مراحل به شرح زیر است: oli> از درجه شیب برای کاهش J (G) استفاده کنید ، یعنی G را بنویسید: = G-dG (J (G)). مرحله 2 را تکرار کنید.

نتیجه گیری

با تکمیل این دوره ، به درک بصری بخش بزرگی از ادبیات بینایی رایانه دست خواهید یافت. تکالیف خانه نیز به شما این امکان را می دهد که خودتان این ایده ها را اجرا کنید. پس از اتمام این دوره ، شما در زمینه بینایی رایانه ای متخصص نخواهید شد ، اما این دوره ممکن است ایده و حرفه بالقوه ای را که ممکن است در بینایی رایانه داشته باشید ، آغاز کند. برای به اشتراک گذاشتن ، در نظرات زیر به من اطلاع دهید. خوشحال می شوم در مورد همکاری احتمالی در پروژه های جدید بحث کنم.

این همه افراد است - اگر تا اینجا موفق شده اید ، لطفاً در زیر نظر دهید و مرا در LinkedIn اضافه کنید.

Github من اینجاست.

Escassez de talentos em IA: Como atrair e reter os melhores!

Escassez de talentos em IA: Como atrair e reter os melhores!

IA tem o potencial de provocar uma transformação social e econômica mais ampla. Assim، a Iorn torna-se cada vez mais important in sociedade porque permite que as capacidades humanas، como entendimento، raciocínio، planejamento، comunicação eceptpção، sejam realizadas for software، de maneira cada vez mais eficaz، eficiente. automação dessas habilidades cria novas oportunidades na maioria dos setores de negócios. Novos PRODUTOS، SERVICOS الکترونیکی ها Recursos significativos possibilitados pela IA incluem، انتر دیگران exemplos، veículos خودگردانی، diagnósticos MEDICOS automatizados، criação د نواخترها drogas، análise automatizada د contratos legais، agentes inteligentes، manutenção preditiva، tradução د textos الکترونیکی VOZ اونا سرعت واقعی، الکترونیکی tomada de decisão muito mais aprimorada. IA não é uma solução que busca um problem ، ما می توانیم با استفاده از این روش ها به سرعت در بازگشت به سرعت یا افزایش هزینه ها دست به کار شویم. به عنوان مثال ، 60 d das ocupações ، pelo menos 30 d das atividades constituintes são tecnicamente automatizáveis. Automatizando estas tarefas، reduz-se o custo operacional e desloca-se as pessoas envolvidas para efetuar atividades de maior valor agregado. برون سازمانی: برآورد داروهای تجویز شده از طریق داروهای تجویز شده توسط ما 355 دلار و هزینه دارو 2 dos دوز داروها برای پیشگیری از مصرف انسان است. Usar IA para acelerar e reduzir o custo deste processo se tangibiliza em centenas de milhões de dólares. Algumas empresas já وابسته به IA برای اپراتور است ، در Netflix ، در 75٪ از مواردی که از کاربران استفاده می شود ، فیلم هایی را توصیه می کند. برای مثال ، یادگیری عمیق به عنوان شبکه های عصبی کانولوشن (CNNs) با استفاده از روش های محاسبه کننده مجدد اجسام به تصویر کشیده می شود. E os algoritmos شبکه های عصبی مکرر (RNNs) criam sistemas de reconhecimento de voz superiores a no noss humanos. E hoje temos um imenso desafio: escassez de talentos. تقاضای ما برای IA é هلال و وجود در ab ism ism re of of of of،،،،، A I abrange diversas atividades e muitas delas exigem competências avançadas em matemática، estatística e programação. Mas، além das habilidades técnicas، cada vez mais os profissionais envolvidos em projetos de IA devem ter conhecimento do domínio do negócio، para interpretar os dados επαρκές و تولید توصیه های مربوطه؛ ما با استفاده از نرم افزار ، برای حل مشکلات موجود در دنیای واقعی ، راه حل هایی را تجربه می کنیم. ترکیبی از رقابت های تکنیکی ، تنظیمات و پیشگیری از تحریم ها از طریق IA limita o tamanho do talentos e faz com que seja eva ária uma equipe diversa. Não existe ninguém que seja bom em tantas e diversas áreas de conhecimento.

همانطور که برآورد می شود ، جهان را در IA variam enormemente بررسی می کنیم. Segundo a Chinesea Tencent pode haver até 300،000 pesquisadores e profissionais deIA no mundo. Os desenvolvedores de IA engajados em desenvolvimento de modelos mais sofisticados são altamente instruídos e quase 60٪ têm mestrado یا doutorado. As pesquisas apontam que os desenvolvedores de IA têm duas vezes mais şans de ter um diploma de mestrado e sete vezes mais şans de ter um doutorado do que out out desenvolvedores profissionais. Portanto، n simo é simple pegar um desenvolvedor Java، com pouca base matemática e convertê-lo em um "ML engineer". Aptender a escrever código Python não o transforma em um engenheiro de ML ، apenas em mais um desenvolvedor Python. IA acessível a desenvolvedores menos especializados. Mas، enquanto isso não acontece، a escassez de talentos está sustentando salários liftados. به عنوان یک مهندس ML و از طریق "مهندس ML" به عنوان "مهندس ML" ، به عنوان یک مهندس ML ، به عنوان یک مهندس ML ، به عنوان یک Linkedin شناخته شده اید! A disputa é intensa e em mercados mais avançados em IA ، como nos EUA ، os setores de tecnologia e serviços financeiros estão absorbvendo 60٪ dos talentos specialpecial emad IA. Pesquisas feitas nos EUA mostram 44٪ dos cientistas de dados estão trabalhando no setor de technologia، mais do que nos setores de saúde، Consultoria، marketing، varejo، Academia e Governo juntos. Os serviços financeiros، com uma participação de 14٪ dos cientistas de dados fica em segundo e bem mais distante lugar. تمرکز بر روی توانایی های ما در Google ، Facebook ، Amazon ، Apple ، Tesla ، Uber e outras de fortíssimo viés tecnológico e ênfase em IA acabam criando uma situação de oligopólio، praticamente impedindo que talentos apareçam em outros start setores e mess e- spars emo starts mesores e- وسایل em- شروع برنامه تنظیمات یو پی اس استارت آپ ها در زمینه رقابت با سیستم های بازرگانی ، در زمینه توسعه فناوری ، به عنوان یک برنامه کاربردی برای ارائه خدمات و ارائه خدمات می توانند به فعالیت بپردازند. um ambiente de trabalho envolvente؛ uma maior oportunidade de ndikar o produto؛ خودمختاری اصلی ؛ ciclos mais rápidos de inovação؛ e maior liberdade de ação. E، claro، destacando as grandes recompensas financeiras de longo prazo que podem oferecer، caso tenham sucesso، for meio de oferta de equity.

Outro dia fiz uma pesquisa informal no Linkedin، buscando cargos relacionados com IA. Os nomes e descrições variavam tanto que ficou difícil até mesmo entender e interpreter que cargos e atividades eram. Lá tem alguns títulos mais ou mesmo estabelecidos como "ML engineer" and cientista de dados، mas encontrei coisas estranhas como "artista ou compositor de dados"، "gênio dos algoritmos" e outros que me deixaram sem saber do que se tratava realmente. با این وجود، می توانید از طریق اینترنت به مدت 20 دقیقه به اینترنت دسترسی پیدا کنید. Neste momento aparece muita coisa boa، mas também surgem oportunistas de plantão، que mal sabem usar Excel e um pouco de SQL e se autodenominam cientistas de dados. Portanto، a combinação de cargos mal definidos e empresas que não sabem bem o que equem recrutar levam a riscos liftados dos seus projetos de IA fracassarem. Dados "sujos" e talentos despreparados são a combinação ideal para fracasso de qualquer iniciativa de IA.

Projetos de IA não conseguem ser tocados for "one man band". Comece com uma equipe pequena e garanta que você tenha uma estratégia robusta de IA antes de expandir sua equipe. A composição da equipe vai depender do problema a ser resolutionvido e da sua abordagem para fazê-lo. Se for "Quero insights sobre dados internos" یا "Quero implementar APIs de IA de terceiros" você vai buscar perfis diferentes de uma estratégia que enfatize "Quero terceirizar o desenvolvimento de IA" یا "Eu quero criar modelos de IA sob meda" O grau de maturidade em IA da sua empresa também vai indicar qual o nível dos profissionais que você precisa. توصیه می شود که از طریق MIT/Sloan متوجه شوید که در BCG ، "AI in Business Gets Real" ، برای استفاده از IA pelas empresas در نظر گرفته شده است. O estudo classifica as empresas em quatro grupos. Pioneiros (18)) ، به عنوان organizações que entendem و já adotaram a IA ، disuinando seu uso pela empresa. Essas organizações estão na vanguarda da adoção da IA ​​em suas ofertas e processos internos. Investigadores (33)): Organizações que entendem a IA ، به طور کلی به کاشت خلبانان کمک می کند. در مورد chatbots یا criam um "AI lab" que faz um prototipo de IA، mas ficam estagnados neste patamar، enfrentando muitas dificuldades de disseminar IA pela empresa آمده است. Experimentadores (16)): Organizações que estão pilotando pilotos IA sem entendimento profundo do que é IA. Vão mais pelo modismo tecnológico que por estratégia de negócio. Não sabem como sair deste estágio. Passivos (34): Organizações sem adoção ou quase sem nenhuma compreensão da IA. Só ficam olhando o mercado و frequando eventos de IA.

بازخوانی مجدد انجام می شود؟ Para evitar contratações errôneas، faça uma descrição eficaz do trabalho que será demandado do (a) professional de IA، enfatizando os projetos em que ele (a) vai se envolver، habilidades e ndiko para o negócio. برای توصیف شغل از طریق "مهندس ML" یا دانشمند داده ، از Google استفاده نکنید ، به عنوان ارگانهای پیشین ، به عنوان خدمات پیش از موعد و خدمات به کار گرفته می شوید. Alguns exemplos que podem servir de referência são a Tesla (Tesla Data Science Interview) ، Amazon (The Amazon Machine Learning Engineer Interview) ، Google (The Google Data Scientist Interview) ، Apple (Apple AI Interview Questions - Acing the Air Interview) e Facebook (مصاحبه علم داده در فیس بوک). به منظور استفاده از پایتون ، فریم ورک Tensor Flow و یا استفاده از آن ، می توانید از طریق برنامه ای برای پیشگیری از برنامه ، از طریق استفاده از Tensor Flow به کار بگیرید. A falta de habilidades afetará seus custos diretamente، pois os indivíduos vão levar tempo para aprender novas tecnologias. Caso não tenha pressa ،validade a capacidade da pessoa se reinventar، aprendendo novas tecnologias Rapidamente. A I está em ثابت و ecelerada evolução e os conhecimento se tornam fastamente defasados ​​ou obsoletos. Descreva os projetos nos quais o candidato selecionado trabalhará. Eles se relacionam com visão computacional، processamento de linguagem natural یا manutenção preditiva؟ برای سهولت درمشاوره ، از اصطلاحات مناسب برای محاسبه استاتاتیک ، طبقه بندی کلاسیک ، رگرسیون ، خوشه بندی ، GAN ، CNN و RNN استفاده کنید. Descreva a expectativa for a função، bem como a dificuldade do problema ser servidido. é apenas um curioso. Alguns exemplos simples de como validação do conhecimento em NLP podem ser encontrados facilmente on internet como em "30 پرسش و پاسخ مصاحبه NLP" و "پرسش ها و پاسخ های مصاحبه NLP که بیشتر در سال 2021 پرسیده می شود."

A maioria dos cientistas de dados e engenheiros de ML procura um trabalho que 'faça a diferença'. Para atrair talentos، demonstre como o trabalho do candidato selecionado fará diferença para o negócio. در مقابل ، os profissionais adaptáveis ​​را اولویت بندی کنید. Além de possuir habilidades técnicas e específicas de função، um bom candidato a ser recrutado deverá saber usar as ferramentas disponíveis para allowir pesquisa e desenvolvimento rápidos؛ saber quando lançar uma solução ainda imperfeita e quando esperar para melhorá-la؛ e، muito importante، ter a capacidade de se comunicar e trabalhar em colaboração. مهارتهای نرم همراه با مهارتهای سخت. Um desenvolvedor de programação tradcional pode efetuar um teste técnico em uma reunião presencial. Os candidatos à IA não podem demonstrators sua capacidade de construir um modelo de IA em uma entrevista، devido às restrições de tempo da própria entrevista. Envolva neste processo os membros existentes da sua equipe de IA. Os melhores candidatosplementam as ideias existeses and trazem algo nova para sua equipe.

به عنوان مثال ، می توانید از اسناد و مدارک پیشین استفاده کنید: در 50 quadros de um vídeo. Alguns são idênticos؛ alguns bem parecidos؛ alguns têm a mesma composição، mas assuntos diferentes؛ e alguns são totalmente diferentes. Um bom candidato entenderá que esse é um problem in de preparação de dados e parasyshrará o ndiko desses dados no treinamento ou teste de um modelo. Uma solução trivial، claramente indicativa de falta de Experiencia، seria identificar imagens idênticas. Já uma solução melhor agruparia as imagens، identificaria uma imagem dominante de cada grupo como uma saída e descartaria o restante. Euma excelente solução entenderia que objeto das imagens pode ser importante and fornecer um script not qual as as characterctas importantes possam ser selecionadas. به عنوان مثال ، مجموعه داده ها برای استفاده از ماوس و استفاده از ماشین و مدل برای استفاده از ماوس و ورود به سیستم و استفاده از ماوس مورد استفاده قرار می گیرد. امexerciseício de biometria. کلارو ، اجازه استفاده از اینترنت را برای اولین بار یا آزمایش کنید. Com testes assim، você já sabe com que nível de conhecimento poderá contar para seus projetos de IA. Reparem، são apenas exemplos. O nível de complexidade dos testes deve estar de acordo com o perfil e habilidades needsárias. به عنوان مثال ، می توانید به این نتیجه برسید که چگونه می توانید از آنها استفاده کنید؟ a pessoa vai trabalhar com algoritmos preditivos ou não-preditivos؟

Os que passarem no teste deverão ir para entrevistas presenciais. Discuta o teste técnico de cada candidato. Eles podem critikar suas próprias soluções؟ O que eles fariam se tivessem mais tempo؟ Essas perguntas fornecerão informações sobre como os candidatos pensam e planejam seu tempo. Um bom talento em IA não fica esperando definições claras como vemos muitas vezes em desenvolvimento de sistemas tradicionais. Eles procuram saídas e alternativas que ninguém mostrou antes. آیا می توانیم از نظر روحی و روانی تجربیات خود را آزمایش کنیم: آیا می توانیم از راه حل های زیر برای مشکلات زیر استفاده کنیم؟ E se houver grandes lacunas nos dados disponíveis ou se a Qualidade dos dados variar؟ آیا می توانید به میزان 50 درصد از سرعت عمل خود استفاده کنید؟ همانطور که تجربیات مناظره ها را مجاز می سازد اجازه می دهد تا یک criatividade do candidato e como ele se saái em um ambiente dinâmico، que oé o mundo real را انجام دهد. Se um candidato tiver o perfil de apenas seguir as etapas descritas nos tutoriais de IA، o ndiko deles nos seus negócios será limitado. Da mesma forma، tenha cuidado com os candidatos que expressam aborrecimento ao enfrentar mudanças nos Requisitos de negócios یا que mbrojtem prazos longos para qualquer alteração. Eles podem não ter as habilidades e o temperamento needários para atuar em projetos que tem alto grau de incerteza، como os de IA. Lembre-se que IA é probabilística por natureza!

Não esqueça. Talentos de IA ainda são escassos. Se você conseguiu atrair bons profissionais، lute para retê-los! Ofereça horários de trabalho flexíveis. Os modelos de IA podem levar muito tempo para serem exeados؛ trabalha-se à noite ou durante os finais de semana، para alterar e refinar os parâmetros. Garanta que sua equipe possui os softwares and hardwares საკმარისი. Crie uma cultura na qual o debate intelectual seja incentivado e diversas ideias sejam compartilhadas. Crie diversidade na equipe. Os avanços na IA são o resultado de vários campos científicos ، دیدگاه های مختلف را برای مساله مسائلی تغییر می دهد. Indivíduos com formação e Educação diferentes veem as coisas de maneira diferente؛ A combinação de suas ideias apresentará novas soluções. همه ما می توانیم به عنوان راهکارهایی برای بیان مشکلات و مجوزهای موجود در نظر بگیریم که می تواند به عنوان یک انگیزه مورد استفاده قرار گیرد.

Garanta que sua equipe de IA receba reconhecimento por seu trabalho. Se os indivíduos trabalharem por meses para desenvolver um bom modelo de IA، será desanimador ver que a equipe que desenvolveu um front-end bonito vai receib todo o crédito.

Decida com antecedência sua abordagem os propriedade intelectual projetos produzirão. Verifique se sua equipe entende suaestratégia de propriedade intelectual، se os membros da equipe podem publicar resultados e se podem apresentá-los em eventos. Muitos profissionais de IA têm carreiras acadêmicas e querem mantê-las. Se sua empresa puder apoiar seus esforços para divulgar seus trabalhos ، isso será konsiderrado um excelente benefício.

Bem، você já tem estratégia e equipe. M naos na massa. Agora é que vai começar o jogo!