ما هي واجهات برمجة التطبيقات للتعرف على الصور ، وما الذي يمكنهم القيام به من أجلك؟ ستوضح هذه المقالة ماهية التعرف على الصور وما يفعله API وكيف يمكن أن يساعدك أنت أو عملك على الحصول على المزيد من الإنترنت. يحتوي التعرف على الصور على إمكانات هائلة للشركات ومستخدمي الإنترنت ذوي الإعاقات البصرية.
ما هي واجهة برمجة التطبيقات للتعرف على الصور؟
التعرف على الصور هو المكان الذي يكتشف فيه برنامج ما خصائص الصورة ويصنفها بدقة. على سبيل المثال ، إذا قمت بتحميل صورة لـ Ferrari 458 إلى واجهة برمجة تطبيقات للتعرف على الصور ، فيجب أن تدرك أنها سيارة وأنها (أو ينبغي أن تكون) حمراء. اعتمادًا على واجهة برمجة التطبيقات ، قد يكون التصنيف الإضافي ممكنًا وفقًا لنوع الصورة التي تستخدمها.
قد يبدو هذا بسيطًا جدًا - يمكن للبشر أن ينظروا إلى الصورة ويخبركم بما هي صورة من دون محاولة ، معظم الوقت - لكن هذه كانت مشكلة صعبة لتعليم أجهزة الكمبيوتر حلها. لقد تم القيام بالكثير من العمل لمعرفة كيف يمكن لجهاز الكمبيوتر أن يفهم كيف تبدو الأشياء ، وقد حققنا خطوات كبيرة ، من القدرة على القيام بعمليات البحث العكسي عن الصور إلى شبكة Deep Dream الشهيرة في Google.
API هي واجهة برنامج التطبيق. إنه في الأساس وسيط بين إجراءات البرنامج التي تخبر أحد العناصر عن كيفية العمل مع آخر ، أو توفر الأدوات التي يحتاجونها لأداء وظيفة. هناك العشرات من أنواع API التي يمكنها تحقيق كل أنواع الأهداف ، باستخدام مجموعة من لغات البرمجة. في هذا السياق ، تعد واجهة برمجة التطبيقات للتعرف على الصور هي الأداة التي يمكنك استخدامها للوصول إلى قوة التعلم العميقة لبعض أنظمة التعرف على الصور التجارية.
أنت بحاجة إلى الكثير من قوة الحوسبة لإجراء التعرف على الصور. تحتاج إلى مجموعات من البيانات والقدرة على تفسير كل شيء. معظم المستخدمين ببساطة لا يملكون موارد ضخمة لبناء آلة التعلم العميق الخاصة بهم. الأسماء الكبيرة مثل Google Vision Vision ، واجهة برمجة تطبيقات Microsoft Face ، و ImageNet ، وغيرها لديها هذه الأجهزة وتسمح بالوصول إليها من خلال واجهات برمجة التطبيقات ، إما مجانًا أو مقابل رسوم. وهذا يتيح للشركات من جميع الأحجام الوصول إلى هذه القوة ، ويمكن للمستخدمين الحصول على تجارب جديدة نتيجة لذلك.
كيف سيؤدي التعرف على الصور إلى تغيير تجربة الإنترنت لدينا؟
سيحصل مستخدمو الإنترنت المختلفون على مزايا مختلفة من التعرف على الصور. دعونا نلقي نظرة على مالك موقع افتراضي ومستخدم افتراضي لنرى كيف يمكن للجانبين الاستفادة.
فوائد العمل من التعرف على الصور
على سبيل المثال ، لنفترض أنك تدير بوابة بيع ذاتية تشبه Etsy أو موقع ويب مواعدة. تريد إدارة جودة وملاءمة جميع الصور التي تم تحميلها من قبل المستخدمين. تريد حظر جميع صور البالغين أو غير الملائمة وترتيبها في الفئات المناسبة ، لكن لا يمكنك القيام بذلك يدويًا.
أدخل واجهة التعرف على الصور API. يمكنك استخدام واجهة برمجة التطبيقات (API) ، جنبًا إلى جنب مع جهاز مناسب لتعريف الصور ، لمسح كل صورة واحدة وتعريفها وفقًا لمعايير محددة. حتى تتمكن من مسح مكتبة الصور بحثًا عن صور غير لائقة وحذفها. يمكنك مسح الصور وفرز الصور التي تحتوي على الطعام في فئة "الطعام" والتريكو في فئة "الصوف". بمجرد إخبار API بما يجب القيام به ، تتم العملية تلقائيًا.
هناك أيضا فرص هنا للواقع المعزز والصورة التفاعلية والفيديو. يمكنك استخدام التعرف على الصور لجعل برنامج يتعرف على الكائنات في العالم الحقيقي. على سبيل المثال ، يمكنك التقاط صورة لزوج من الأحذية الرياضية يرتديها شخص ما في الشارع. إذا كان البرنامج يتعرف على الأحذية الرياضية ، فيمكن زيادة الصورة بواسطة رابط لشرائها بنفسك. هذا يستفيد من الأعمال (يوفر فرصة مبيعات فورية) ويفيد المستخدم (يحصلون على ما يريدون في الوقت الحالي).
فوائد المستخدم من التعرف على الصور
مثال حذاء رياضة أعلاه هو مجرد وسيلة واحدة يمكن للمستخدمين الاستفادة من التعرف على الصور. الواقع المعزز يعني أنه يمكننا الوصول على الفور إلى المراجعات ومعلومات الأسعار والكثير من البيانات ببساطة عن طريق التقاط صورة لأحد المنتجات. يوفر ذلك للمستخدمين كميات هائلة من البيانات لمساعدتهم في اتخاذ قرار الشراء.
لخص مارك زوكربيرج فائدة غالبًا ما يتم التغاضي عنها في التعرف على الصور في خطابه على الذكاء الاصطناعي في وقت سابق من هذا العام. لقد تصوّر واجهة برمجة التطبيقات للتعرف على الصور التي عملت مع أشخاص مكفوفين أو ضعيف البصر يمكنهم "قراءة" صورة ووصف ما تراه بصوت عالٍ. قد يكون لهذا الأمر تداعيات هائلة على مستخدمي الإنترنت المعاقين - أو ، مع الواقع المعزز ، في العالم الواقعي بعض الوقت.
يلعب التعرف على الصور أيضًا دورًا في سلامة السيارة. تعمل تقنيات المكابح الذاتية الجديدة وتجنب الاصطدام التي يتم تقديمها بشكل مشابه لواجهة برمجة التطبيقات التي نتحدث عنها. يقومون بمسح الصور ضوئيًا وتقييمها عدة مرات في الثانية للحفاظ على سلامتك وسيارتك أثناء السير على الطريق. هذه التكنولوجيا التي تخبر السيارات المستقلة ما هو حولها ، أيضا.
واجهات برمجة التطبيقات للتعرف على الصور لن تحدث ثورة في تجربة الإنترنت الخاصة بنا. إنها تعمل جنبًا إلى جنب مع التكنولوجيا الحالية لإضافة طبقة من التفاعل والانغماس في العالم الذي نراه. على الرغم من أن أمثلة هذه المقالة محدودة ، إلا أن هناك إمكانات هائلة للألعاب والأفلام وصناعة السيارات وتجارة التجزئة والترفيه وأي صناعة تدعم التكنولوجيا. هذه مجرد بداية لما تستطيع الأنظمة الذكية تحقيقه!