الرئيسية / تطبيقات برمجية (صفحه 2)

تطبيقات برمجية

رسومٌ متحركة من صنع الخوارزميات

الرسومُ المتحركةُ هي سلسلةٌ من الصور المتتالية تحكي قصة ما، وغالبًا ما تكون هذه الصور مرسومة باليد لما يمتلكه هذا الفنُّ من دقَّة وإحساس يجعل تعلُّمه من قِبَل الآلة صعبًا جدًّا، ومكلفًا للغاية.ولذلك؛ يُعدُّ وجودُ خوارزميةٍ يمكنها تحويل أية صورةٍ إلى رسومٍ متحركة دون مواجهة صعوباتٍ ثورةً في مجال تعليم الآلة.الخوارزميات السابقة:تمكَّن فريق بحثٍ ألماني في بداية عام 2015 من نقل نمطٍ فني بين صورةٍ وأخرى، وتتابعت الأبحاث بعدها؛ إذ تمكَّن العلماء من نقل أسلوب فنانين عظماء مثل "بيكاسو" و"فان جوخ" إلى صورٍ أخرى.استُخدامت خوارزميات الشبكات العصبونية في هذا المجال على يد "ليون غاتيس" Leon Gatys في جامعة "توبينغن" University of Tubingen، وعددٍ قليل من الزملاء؛ إذ درسوا طريقة الخوارزمية في تسجيل النمط الفني وتحليله، ولمّا كانت الشبكات العصبونية تتكون من طبقاتٍ مختلفة؛ توصلوا إلى جعل كل طبقةٍ تحلِّلُ مستوى مختلف من الصورة كالشكل والألوان والخطوط.تتمثل الفكرة الرئيسة في عمل "غاتيس" في عدم تصوير النمط الفني في الطبقات بحد ذاتها، بل في الارتباطات فيما بينها، مما أتاح القدرة على فصل أسلوب الفنان عن المحتوى ونقله إلى صورة أخرى؛ فكانت هذه الفكرة أساسًا لمنظومةٍ جديدة عُرفت بنقل النمط العصبي.واجه "غايتس" -على الرغم من كمالية هذه الفكرة- مشكلةً وحيدة، وهي ضخامة العملية وكثافتها بالنسبة إلى الحواسيب؛ إذ تستغرق العملية وقتًا طويلًا لفصل الطبقات وتحليلها، لذلك بدأ علماء الحاسوب في البحث عن أساليب مختلفة تؤدي المهمة بسرعة أكبر وبالجودة والكفاءة نفسها.إيجاد الخوارزمية البديلة:تمكن الباحثان Maciej Pesko "ماتشي بيسكو"، و Tomasz Trzcinski "توماس ترتستشنسكي" في جامعة "وارسو/بولندا" من تحويل الصور إلى رسومٍ متحركةٍ مستخدمين الخوارزميات العصبونية أيضًا، وتقنيات نقل الأسلوب الفني بين صورة وأخرى؛ هادفين إلى توليد صورٍ بأسلوب الفنانين الكبار، وتحويل الصور من صور ليلية إلى نهارية، والقدرة على تبديل الوجوه في الصور.اختبر "بيسكو" و "ترتستشنسكي" مجموعةً واسعةً من خوارزميات نقل النمط العصبي في مهمةٍ محددة وهي نقل أنماط رسوم ذات طابَعٍ كرتوني.وللحصول على الخوارزمية الأنجح؛ اختبر الباحثان خمسَ خوارزميات مختلفة على صور بأبعاد 600x450 بيكسل، والتي عولجت باستخدام وحدة معالجة الرسومات "تيتان اكس" TitanX بسعة 12 جيجا بايت.وعُرضت النتائج على 100 شخص بهدف تقييم أفضل نتيجة، فكانت غالبية الأصوات لصالح تقنية التطبيع التكيفي adaptive instance normalization؛ إذ تعطي هذه التقنية نتائج أقرب إلى الرسوم الكاريكاتورية أو الرسوم الهزلية من حيث تشابه الأسلوب.Image: https://physicsworld.com/a/transforming-photographs-into-cartoons-using-neural-algorithms-and-jumping-sharks/وقد كانت هذه الصورة a jumping horse and rider هي الصورة الأولى التي حولها Maciej Pesko باستخدام التقنية الجديدة، ومع ذلك نرى أن النتائج ليست مثالية على الإطلاق؛ فجميع التقنيات تعاني إلى حد ما مشكلاتٍ مثل نقل اللون غير الملائم والضبابية وغيرها.وختامًا؛ يعتقد الباحثون أنهم سيتمكنون من إيجاد حلٍّ لهذه المشكلات.

أكمل القراءة »

تعريف بتعلم الآلة

تشير غالبية التطورات والتطبيقات التي نسمعها عن الذكاء الصنعي في الوقت الراهن إلى فئة من الخوارزميات المُدرَجة تحت مجال تعلم الآلة Machine Learning. تَستخدم خوارزميات تعلم الآلة الإحصاءَ لاستخلاص الأنماط من كميات كبيرة من البيانات، وتشمل هذه البيانات الأرقام والكلمات والصور، وحتى تفاعلك على مواقع التواصل! وإن أمكن تخزينها رقميًّا؛ أمكن إدخالها في خوارزمية تعلم الآلة.تعلم الآلة هو الآلية التي تمكّن العديد من الخدمات التي نستخدمها اليوم؛ مثل أنظمة التوصيات في التطبيقات ومحركات البحث ووسائل التواصل الاجتماعي والمساعد الشخصي وغيرها من العمل...

أكمل القراءة »

Infer.NET مكتبة مايكروسوفت لتعلم الآلة مفتوحة المصدر!

ما المقصود بـ Infer.NET؟إطار عمل لإدارة الاستدلال البايزي Bayesian inference (نسبة إلى عالم الرياضيات Bayes صاحب النظرية الشهيرة في الاحتمالات المرتبطة؛ أي احتمال حدوث حدث علمًا بأن حدثًا آخر قد وقع) في النماذج البيانية، ويمكن استخدامه أيضًا في البرمجة الاحتمالية. يستخدام Infer.NET لحل أنواع مختلفة من مشكلات تعلم الآلة؛ بدءًا من المشكلات القياسية العامة مثل التصنيف Classification أو التوصية Recommendation أو التجميع (العنقدة) Clustering، إلى حلول مخصصة للمشكلات المتعلقة بمجال معين، وقد استخدم Infer.NET في مجموعة واسعة من المجالات؛ بما في ذلك استرجاع المعلومات، والمعلوماتية الحيوية، وعلم الأوبئة، والرؤية، وغيرها الكثير.يُنشر Infer.NET الآن مصدرًا مفتوحًا على GitHub بموجب ترخيص من معهد ماساتشوستس للتكنولوجيا ويتوفر أيضًا على هيئة حزم NuGet.إن جعل Infer.NET مفتوح المصدر يمثل تتويجًا لرحلة طويلة وطموحة؛ إذ شرع فريق Microsoft Research في كامبريدج في المملكة المتحدة تطوير منصة العمل هذه في عام 2004، وقد تعلّموا الكثير في سبيل إنشاء حلول تعلم الآلة قابلة للتوسع والفهم. ...

أكمل القراءة »

نمط مِشيتك.. بصمتك المستقبلية

قد تظن أنَّ تعرُّفَ الأشخاص عن طريق تحليل طريقة مِشيتهم بواسطةِ نظام حاسوبيٍ ذكي ما هو إلّا مجرد واحدٍ من العديد من الخيالات العلمية التي تُستخدَم في أفلام هوليوود فحسب.ولكن في الحقيقة؛ أصبحَ الخيال واقعًا بعد أن حصلت شركة صينية تدعى ويتريكس Watrix مؤخّرًا على تمويل بقيمة 14.5 دولار لتسريع نمو تقنية التعرف إلى الأشخاص بتحليلِ طريقة مِشيتهم، التي تُطوّرت لتستخدَمها الحكومة الصينية.أنشأت شركة Watrix برنامجًا يعتمد الذكاء الصنعي؛ قادرًا على تحديد الأشخاص فقط عن طريق تحليل طريقة مشيهم.وردًّا على تساؤلاتك الآن: لا، لا يمكنك خداع هذا البرنامج بتقليد مِشيةِ شخص ما. يقول هوانغ يونغ تشن Haung Yongzhen؛ رئيس شركة Watrix التنفيذي: "لا نحتاج إلى تعاون الناس معنا من أجل أن نكون قادرين على تحديد هويتهم؛ فلا يمكن خداع نظامنا ببساطة عن طريق العرج أو المشي مع تباعد الأقدام أو حتى الانحناء؛ لأنَّنا نحلل جميع مميزات الجسم، ويصل معدل دقة التقنية حسب هوانغ Haung إلى 94%...

أكمل القراءة »

الرؤية في الظلام

يوجد الضجيج في أي نظام تصوير، وهو اختلاف عشوائي  في معلومات السطوع أو اللون في الصور؛ الأمر الذي يجعل من التصوير أمرًا صعبًا، وخاصة في الإضاءة المنخفضة؛ إذ يُعدُّ التصوير في مثل هذه الحالة تحديًّا كبيرًا؛ ذلك بسبب انخفاض عدد الجزيئات الضوئية (الفوتونات) التي تمثل الصورة أو المشهد، وبسبب محدودية معالجة الضجيج العالي الناتج عن الإضاءة المنخفضة أيضًا.وتُستخدم تقنيات متعددة لحل مشكلة الضجيج، وترفع تقنية (ISO) -على سبيل المثال- السطوع في الصورة، وبذلك تؤدي إلى حدوث ضبابية، وتستخدم أيضًا تقنية التكبير أو المدرج التكراري (histogram stretching)، ولكن؛ لا تحل هذه الحلول المشكلة الأساس وهي انخفاض عدد الجزيئات الضوئية المكوِّنة للصورة بسبب الإضاءة المنخفضة؛ ما أدى إلى بدء العمل على إيجاد حلول لهذه المشكلة، وقد كان أفضلها استخدام تقنية (open aperture)، وهي عبارة عن مرشح  (filter) يتحكم بكمية الضوء الداخل إلى العدسة أو باستخدام الطريقة الأكثر شيوعًا وهي استخدام الفلاش، ولكل من هذه الحلول عيوبه، فمثلاً: يمكن أن ينتج عن زيادة فترة التعرض إلى الضوء باستخدام الفلاش حدوثَ تغبيش في الصورة، وخصوصًا في حالة اهتزاز الكاميرا أو العنصر الموجود في الصورة.وانطلاقًا من هذه المشكلات التي مررنا بها؛ وجد الباحثون طريقة لحل مشكلة الضوء المنخفض؛ وطوروا نظامًا لمعالجة هذه الصورة غير الواضحة بعد أن وجدوا مجموعة من الصور ذات الإضاءة المنخفضة ومقابلاتها من الصور عالية الدقة والتي التُقطت في ظروف إضاءة جيدة، ودُرِّبت شبكة عصبونية مرتبطة بحساسٍ يقرأ البيانات مباشرة، وتوجد الصورة المقابلة لها بعد عدة مراحل؛ منها تحسين الصورة الملتقطة من الحساس ومراعاة تحويلات الألوان والحد من الضجيج في الصورة، وتحدث هذه المراحل على التوازي باستخدام مبدأ pipeline، والذي يعني تنفيذ أكثر من إجرائية أو تعليمة متداخلة في آن معًا.الموضوع شيّق جداً عزيزي القارئ؛ لذلك أعرني انتباهك  قليلًا، وهيا نستكشف المراحل التي تمر بها أيّة آلية معالجة الصورة المعتمة وغير الواضحة.مرحلة التخلص من الضجيج:طُرحت العديد من التقنيات والأساليب في هذا المجال؛ منها التباين الكلي (total variation) ومعالجة مجال المويجات (wavelet-domain processing) والترميز المتقطع والمرشح ثلاثي الأبعاد (BM3D)، وتستند هذه التقنيات في عملها غالبًا إلى  صور فيها خصائص معينة؛ منها النعومة والتراخي والتشابه الذاتي (self-similarity)،وقد وجد الباحثون طرائق أخرى لمعالجة هذه المشكلة؛ منها استخدام الشبكات العصبونية المدربة مع مكدس التشفير العشوائي للتشويش (SSDA) وتقنية رد الفعل اللاخطي (INRQ)، ولكن للأسف؛ قُيّمت هذه التقنيات كلّها بعد تجريبها على بيانات غير حقيقية؛ أي ليست خام؛ بل عُدِّلت وأضيفت الضبابية والضجيج، ولكن بالنهاية، وبعد البحث والتجريب؛ اقتُرحت  طريقة المرشح الثلاثي الأبعاد بوصفها أفضل طريقة في معالجة الضجيج في الصور المأخوذة على نحوٍ خام وطبيعي.مرحلة تحسين الصورةتُطبق مجموعة متنوعة من التقنيات لتحسين تباين الصورة؛ ومنها (Histogram eqiztion) والتي توازن الخطوط البيانية المكونة للشكل الموجود في الصورة أو تصحيح غاما (Gma Correction) الذي يزيد من سطوع المناطق المظلمة عن طريق ضغط البكسلات الساطعة، وهناك العديد والعديد من هذه الطرائق، وكانت الأكثر تقدمًا هي القناة العكسية (inverse dark chanel) أو تحويل ويفلت (wavelet transform) أو أنموذج ريتنكس (Retinex) وكل خوارزمية تنفرد باستخدام واحدة من هذه التقنيات.مرحلة جمع البيانات أو أزواج الصورتؤدي هذه المجموعات دورًا أساسًا في معالجة الصور؛ إذ تُربط مع الشبكة العصبونية التي يتكون منها النظام، والتي بدورها تتخذ القرار وتختار الصورة المشابهة للصورة المعتمة ليعالج، وتطبق المراحل السابقة على أساس الصورة الأكثر دقة، وذلك بعد تدريبها من قبل المطورين، ومن هذه المجموعات نذكر على سبيل المثال (Renoir)؛ ولكن مشكلتها أن أزواج الصورة فيها تعاني اختلاطًا مكانيًّا (MisAlignment)، وتوجد مجموعة تدعى (DND) أيضًا، ولكن مشكلتها أن معظم الصور تُلتقط  في وضح النهار، وليست مناسبة للمقارنة .وأما الأفضل؛ فهي مجموعة (SID) التي تحوي على ما يقارب 5094 صورة مأخوذة في الداخل وفي الخارج وفي الليل وتحت ضوء القمر أو إضاءة الشوارع .Image: arxiv.org"عينة من صورمجموعة (SID) المستخدمة في المطابقة"التُقطت هذه العينات بنوعين من الكاميرات (sony) و (fuji) من الأعلى والأسفل ومن اليمين والشمال، وخصائص كل كاميرا موضحة بالجدول أدناه :خوارزمية المعالجةبدايةً؛ مرّت الطرائق التقليدية السابقة بالتسلسل على المراحل التي ذكرناها آنفًا؛ كالتخلص من الضجيج وتحسين الصورة والتخلص من الضبابية والأسلوب المتبع نفسه مع اختلاف التقنيات المستخدمة بين كل خوارزمية وأخرى، ونجد أدناه بعض المراحل التي كانت تكون عملية المعالجة:Image: arxiv.orgفي حين تمر الطريقة التي تتكون من الشبكة العصبونية المدربة بالمراحل الآتية:يلتقط الحساس الموجود في العدسة الأشعة الضوئية المكونة من الفوتونات ويصنفها عن طريق ثلاثة أنواع من الفلاتر (أحمر - أخضر - أزرق)، والتي تمثل الألوان الأساس المكونة لأي لون في الطبيعة وتخزن في مصفوفة ثنائية البعد؛ كل عنصر فيها يحوي لونًا واحدًا فقط .يصنف بعدها كل لون على حدة باستخدام  خوارزمية (Byeer Filter)؛ إذ توزع الألوان على أربعة أقنية؛ واحدة للون الأحمر وواحدة للون الأزرق وقناتين للون الأخضر؛ ذلك لأن العين تتحسس بشدة للون الأخضر عن باقي الألوان، وتخزن هذه القيم اللونية على هيئة مصفوفات ثنائية البعد، وتضرب كل مصفوفة بمعامل التضخيم الذي يمثل اللمعان المطلوب في الصورة.وتدخَل هذه النتائج إلى المرحلة المركزية، وهي الشبكة العصبونية ليُتّخذ القرار، وتُختار الصور الأقرب للصورة الملتقطة الخام والمعتمة، بعد أن تطبق المراحل التي تحدثنا عنها من تحسين للصورة والتخلص من الضجيج وتطبيق بالتحويلات اللونية استنادًا إلى الصورة المنتقاة والواضحة، وهكذا نكون قد حصلنا على صورة واضحة جلية على الرغم من التقاطها في ظروف إضاءة ضعيفة.Image: arxiv.orgأظهرت الدراسة السابقة أن معالجة الصور المعتمة والمأخوذة في ظروف إضاءة غير جيدة هي أحد أكثر موضوعات البحث تحديًّا ونشاطًا في علوم الحاسوب؛ إذ لم يقتصر لأمر على التقاط صورة  واضحة في وضح النهار وبظروف إضاءة مناسبة؛ بل تطور للتعرف إلى الصورة ومحتواها وإن التُقطت في الظلام، وترتَّب على ذلك مواجهة العديد من المشكلات والتحديات ومن تلك التحديات الضجيج والضبابية وتصنيف المعطيات والتحليل المرئي.وبعد الدراسة والتجارب؛ وجدت مجموعات من أزواج الصورة الواضحة والمعتمة واتُّبعت خوارزمية لتتبع الضجيج ومعالجته وتصحيحه، وبذلك أصبحنا قادرين على التقاط الصور مهما كانت الظروف المحيطة بنا؛ سواء أكانت إنارة جيدة أم ظلام حالك.الشيفرة البرمجية: هنا المصادر:هناهناهناهناهناهنا * إعداد: : Emad Aldeen Moslet* تدقيق علمي: : Mujeeba Haj Najeeb* تدقيق لغوي وتعديل الصورة ونشر: : Dima Yazji

أكمل القراءة »

نظام تعلم آلة لتعرّف الصوت والشكل معًا.

طور علماء الحواسيب في معهد MIT نظامًا بإمكانه فرز الأغراض الموجودة داخل صورة، وذلك بالاعتماد على توصيف منطوق لهذه الصورة؛ بإعطاء هذا الأنموذج صورة وتسجيلًا صوتيًّا سيحدد هو بدوره  المناطق الموجودة في الصورة، والتي وُصِّفت في المقطع الصوتي.على العكس من تقنيات التعرف الصوتي الحالية، فإن هذا الأنموذج لا يحتاج إلى إدخال يدوي للنصوص والتعليقات التوضيحية الخاصة بالأمثلة التي قد تدرب عليها، وعوضًا عن ذلك؛ سيتعلم الكلمات مباشرة عن طريق المقطع الصوتي المسجَّل والأغراض من الصور الأولية، وسيربط فيما بعد لغرض مع الوصف الصوتي الخاص به.يمكن للأنموذج في الوقت الحالي أن يتعرّف  عددًا محدودًا من الكلمات والأغراض من مختلف الأنواع، وقد يصل عددهم إلى بضعة مئات، ولكن؛ يأمل الباحثون أن تتمكن تقنية تعرف الكلام -في يوم من الأيام- من توفير عدد كبير من ساعات العمل اليدوي، وأن تفتح أبوابًا جديدةً في مجال تعرّف الصوت والصورة.وعلى سبيل المثال؛ تتطلب نظم تعرّف الصوت مثل سيري Siri وجوجل فويس Google voice تفريغَ آلاف الساعات من التسجيلات الصوتية، ثم باستخدام البيانات الناتجة عن عملية التفريغ؛ ستتعلم الأنظمة وضع خرائط تربط إشارات الكلام بكلمات محددة، ولكن تكمن المشكلة عند إدخال مصطلحات جديدة إلى القاموس؛ هذا سيجعل من إعادة تدريب الأنظمة أمرًا واجبًا.ويقول ديفيد هارواث؛ الباحث في مختبر علوم الحاسوب والذكاء الصنعي CSAIL ومجموعة الأنظمة المحكية: "أردنا أن نحقق تعرّف الكلام بطريقة تكون أقرب إلى الطبيعية، وذلك للاستفادة من الإشارات والمعلومات الإضافية التي ستكون ذات منفعة للبشر، والتي لا يمكن لخوارزميات التعلم الآلي عادةً الوصول إليها، وقد كان لدينا فكرة تدريب أنموذج بأسلوب مشابه لسير الطفل عبر العالم ورواية ما يراه"، وقد شارك هارواث في تأليف ورقة بحثية تصف الأنموذج الذي قُدِّم حديثًا في المؤتمر الأوروبي الذي تناول موضوع الرؤية الحاسوبية.وأثبت الباحثون في هذه الورقة أنموذجهم عن طريق تجربته على صورة فتاة صغيرة ذات شعر أشقر وعينين زرقاوتين، وترتدي هذه الفتاة فستانًا أزرق، وكانت تحوي خلفية الصورة منارةً بيضاء لها سقف أحمر؛ تعلَّم الأنموذج ربط أيّ البيكسلات في الصورة تتطابق مع الكلمات "فتاة" و"شعر أشقر" و"عينان زرقاوتان" و"فستان أزرق" و"منارة بيضاء"، وأخيرًا "سقف أحمر"، واستطاع الأنموذج وضع إشارة على كل من هذه التفصيلات في الصورة في أثناء وصفها.إنّ أحد التطبيقات الواعدة هو تعلم الترجمة بين اللغات المختلفة دون الحاجة إلى حواشي ثنائية اللغة، ومن بين ما يقدر بـ 7000 لغة منطوقة عالميًّا؛ هناك فقط ما يقارب 100 لغة لديهم ما يكفي من نسخ البيانات لتعرف الكلام، ولنفكر في موقف توصف فيه صورة واحدة من قبل شخصين يتحدثان بلغتين مختلفتين؛ فإنْ كان الأنموذج يتعلم إشارات الكلام من اللغة المنطوقة من قبل الشخص الأول والتي تطابق الأغراض في الصورة، ويتعلم إشارات الكلام من اللغة المنطوقة من قبل الشخص الثاني والتي تطابق هذه الأغراض نفسها، فبإمكان الأنموذج حينها عدُّ هاتين الإشارتين تُترجِمان بعضهما.ويقول هارواث: "هناك إمكانية لوجود آلات ميكانيكية من نوع سمكة بابل"؛ مشيرًا إلى سماعة الأذن الحية الخيالية في روايات "دليل المرشد إلى المجرة"، والتي تترجِم مختلف اللغات لمرتديها.الارتباطات السمعية البصرية:يتوسع هذا العمل عن الأنموذج السابق المصمَّم من قبل هارواث وغلاسس وتورالبا، والذي يربط الكلام مع مجموعات من الصور التي ترتبط ببعضها بموضوعات متشابهة، ووضعوا في أثناء البحث السابق صورًا تحوي مشاهد مأخوذة من قاعدة بيانات تصنيفية مخزنة في منصة التعهد التركي الآلية، وبعد ذلك؛ جلبوا أشخاصًا ليصفوا الصّور كما لو أنهم يصفونها إلى طفل مدّة عشر ثوان، وجمع المصممون أكثر من 200 ألف زوج من الصور والمقاطع الصوتية لمئات الموضوعات المختلفة؛ مثل الشواطئ ومراكز التسوق الكبيرة وشوارع المدينة وغرف النوم.ومن ثم صمموا أنموذجًا يتكون من شبكتين عصبونيتين منفصلتين convolutional neural networks (CNNs)؛ واحدة من هذه الشبكات لمعالجة الصور، والأخرى للعمليات على الطيف الضوئي والتمثيل البصري للإشارات الصوتية؛ ذلك لكونها تتغير بمرور الوقت، وتحسب الطبقة العليا من الأنموذج المخرجات الخاصةَ بالشبكتين، وتربط أنماط الكلام مع بيانات الصورة.فعلى سبيل المثال؛ سيعطي الباحثون الأنموذجَ مقطعًا توضيحيًّت أوليًّا مع الصورة الأولى، وبعد ذلك؛ سيعطونه مقطعًا عشوائيًّا ثان مع الصورة الأولى، والذي يُعدُّ تصرفًا خاطئًا؛ إذ  لا يتعلق المقطع الصوتي بالصورة، وبعد مقارنة آلاف المقاطع التوضيحية الخاطئة مع الصورة الأولى؛ استطاع الأنموذج تعلم إشارات الكلام المتعلقة بالصورة الأولى، وربط هذه الإشارات بالكلمات المذكورة في المقطع التوضيحي.

أكمل القراءة »

وجوهٌ بشرية والذكاءُ الصنعيُّ هو المُبتكِر!

نعم نعم؛  فأنتم ترون في الصورة وجوهًا لشخصياتٍ مُوَلَّدةً صنعيًّا ولا وجودَ لها البتة على أرض الواقع!كيفَ ذلك؟تعرّفوا الآن …قد تكون قدرةُ الذكاءِ الصنعيِّ على توليد صورٍ مزيفةٍ ومُشابهة لوجوهٍ أخرى دُرِّب عليها مُسبقًا أمرًا مألوفًا نوعًا ما؛ لكن ماذا عن توليدِ وجوهٍ مُزيفةٍ وواقعيةِ المظهر وخادعةِ الإحساس على نحوٍ منقطعِ النظير؟نعم؛ فقد صمّم باحثون من إنفيديا NVIDIA بنيةً جديدةً لخوارزمية GAN؛ الخوارزمية التوليدية التنافسية، والتي من شأنها توليد وجوه واقعية متعدّدة السمات بدون أيّ تدخل بشري.التوليد المُعتمِد على السمات:تتعلّم الخوارزمية سمات الوجوه المُختلفة على نحوٍ منفصل، وذلك بدون تدخل بشري، ومن ثَمّ -بعد التدريب-  يمكن دمج هذه السمات المختلفة بعضها مع بعض، وتوليد وجوه بالطريقة التي ترغب بها.يَعُدُّ المولّدُ الصورَ على أنها مجموعةٌ من السمات؛  تُحدِث كُلّ سمة تأثيراتٍ ضمن نطاقٍ مُعيّن؛ فعلى سبيل المثال: هنالك سمات واسعة النطاق مثل الوضعية والشعر و شكل الوجه، وسمات مُعتدلة مثل العيون وتفاصيل الوجه، وسمات بسيطة ضيقة النطاق مثل لون البشرة.أضف إلى ذلك، إمكانية التلاعُب في شكل السمات واسعة النطاق؛ فمثلاً يُمكنك التلاعُب بخصلات الشعر؛ إضفاء نعومة المظهر عليها أو تحريكها أو تحديد نسبة المؤثر الذي تطبقه حتى؛ كيف تكون الصورة واقعيةً أكثر ما يُمكن.مَهلاً...!ليست الوجوهُ بطلةَ المسرحِ بمُفردها؛ بل طالَت بِدَعُ هذا المولِّد مجموعات تدريبٍ أُخرى، مثل: السيارات والأسِرّة والهررة.Image: https://arxiv.org/pdf/1812.04948.pdfلا تفوّت مُتعةَ مُشاهدةِ الوجوه الموَلَّدة بواسطة هذه البنية، هنا:https://www.youtube.com/embed/kSLJriaOumA?feature=player_embedded&theme=lightلتفصيلات أكثر؛ زوروا الرابط الآتي: هنا   المصادر:   هنا هنا * ترجمة: : Nour Abdou* تدقيق علمي: : Bassel Zeno* تدقيق لغوي وتصميم الصورة ونشر: : Dima Yazji

أكمل القراءة »

الذكاء الصنعي.. فنان تعبيري

يعود الأمر بمجمله إلى خوارزميةٍ دُربت على 15000 لوحة بورتريه؛ ففهمت قواعد رسم البرورتريه ونفَّذتها ورسمت لوحةَ بورتريه بالحبر. أما التوقيع فكان معادلةً رياضية!توقيع الخوارزمية على لوحة البورتريه التي رسمتهاImage: https://cdn-images-1.medium.com/max/1600/1*A7Z-6X0cJ4BH8BgS2U7pzg.pngما هو الذكاء الصنعي التعبيري Expressive AI؟ يعرَّفُ الذكاء الصنعي التعبيري بأنه: مجالٌ فرعيٌ من الذكاء الصنعي. يستعين هذا المجال بالممارسات البحثية لكلٍّ من الفن والذكاء الصنعي، ويوصف بأنه ممارسةٌ هجينةٌ بين الفن والعلم.ما هي الخوارزمية التي مكَّنتنا من هذا الإنجاز؟تُسمى هذه الخوارزمية: الشبكة التنافسية الإبداعية (Creative Adversarial Network) أو اختصارًا CAN، وتعمل على توليد الفن عن طريق التعلم من مجموعةٍ من الأنماط، وتصبح مبدعةً بابتعادها عن الأساليب المتعلَّمة.وقد بُنيت اعتمادًا على الشبكة التنافسية التوليديَّة (Generative Adversarial Network) أو اختصارًا GAN، والتي أثبتت قدرتها على تعُّلم توليد صورٍ جديدة تحاكي توزيعًا معينًا.الشبكة GAN في أصلها هي شبكةٌ عصبونيةٌ صنعية لها أثر كبير في مجال الذكاء الصنعي، وتتكون هذه الشبكة من شبكتين عصبونيتين؛ إحداهما توليدية Generative، والثانية تمييزية Discriminative، وتعملان معًا لتحقيق محاكاةٍ عالية المستوى للمهام المتصوَّرة.تبني الشبكة التوليدية Generative مخرجاتها من المدخلات (الصور في مثالنا)، وترسلهم إلى الشبكة التمييزية Discriminative التي تميز بدورها -كما توحي تسميتها- بين النتائج الأصلية والصناعية المقدَّمة من الشبكة التوليدية...

أكمل القراءة »

الآلة تجد طريقها إلى العيادة النفسية..

في السنوات الأخيرة، كان لتعلّم الآلة دورٌ مفيد في تشخيصِ الأمراض، وعلى سبيل المثال؛ طُوِّرت نماذج لتعلُّم الآلة قادرةٌ على تحديدِ كلمات أو مقاطع (أي أنماط Patterns) من الكلام تدلُّ على الاكتئاب، وتحدِّد ما إذا كان الشخص مُكتئبًا أو لا؛ استنادًا إلى إجاباتِه عن أسئلة معينة. ...

أكمل القراءة »