كيفية معالجة الصور الرقمية Digital image processing

تقليص
X
 
  • تصفية - فلترة
  • الوقت
  • عرض
إلغاء تحديد الكل
مشاركات جديدة

  • كيفية معالجة الصور الرقمية Digital image processing

    معالجة الصور الرقمية - Digital image processing

    المعالجة الحسابية للصور الممثلة رقميًا
    معالجة الصور الرقمية هي استخدام كمبيوتر رقمي لمعالجة الصور الرقمية من خلال خوارزمية . باعتبارها فئة فرعية أو مجالًا من معالجة الإشارات الرقمية ، فإن معالجة الصور الرقمية لها مزايا عديدة مقارنة بمعالجة الصور التناظرية . يسمح بتطبيق نطاق أوسع بكثير من الخوارزميات على بيانات الإدخال ويمكن أن يتجنب مشاكل مثل تراكم ضوضاء و تشويه أثناء المعالجة. نظرًا لأن الصور يتم تعريفها عبر بعدين (ربما أكثر) ، فقد يتم نمذجة معالجة الصور الرقمية في شكل أنظمة متعددة الأبعاد . يتأثر توليد وتطوير معالجة الصور الرقمية بشكل أساسي بثلاثة عوامل: أولاً ، تطور أجهزة الكمبيوتر ؛ ثانيًا ، تطوير الرياضيات (خاصة إنشاء وتحسين نظرية الرياضيات المنفصلة) ؛ ثالثًا ، ازداد الطلب على مجموعة واسعة من التطبيقات في البيئة والزراعة والجيش والصناعة والعلوم الطبية.
    التاريخ
    العديد من تقنيات معالجة الصورة الرقمية ، أو معالجة الصور الرقمية كما كانت تسمى غالبًا ، تم تطويرها في الستينيات ، في مختبرات بيل ، مختبر الدفع النفاث ، معهد ماساتشوستس للتكنولوجيا ، جامعة ميريلاند ، وعدد قليل من مرافق البحث الأخرى ، مع تطبيق صور القمر الصناعي ، صورة سلكية تحويل المعايير ، التصوير الطبي ، هاتف مرئي ، التعرف على الأحرف ، وتحسين الصورة. كان الغرض من معالجة الصور المبكرة هو تحسين جودة الصورة. كان يهدف للبشر لتحسين التأثير البصري للناس. في معالجة الصور ، يكون الإدخال صورة ذات جودة منخفضة ، والمخرج هو صورة ذات جودة محسنة. تتضمن معالجة الصور الشائعة تحسين الصورة والاستعادة والتشفير والضغط. كان أول تطبيق ناجح هو مختبر الدفع النفاث الأمريكي (JPL). استخدموا تقنيات معالجة الصور مثل التصحيح الهندسي ، وتحويل التدرج ، وإزالة الضوضاء ، وما إلى ذلك على آلاف الصور القمرية التي أرسلها Space Detector Ranger 7 في عام 1964 ، مع مراعاة موقع الشمس وبيئة القمر. كان تأثير التعيين الناجح لخريطة سطح القمر بواسطة الكمبيوتر نجاحًا كبيرًا. في وقت لاحق ، تم إجراء معالجة أكثر تعقيدًا للصور على ما يقرب من 100000 صورة أرسلتها المركبة الفضائية ، بحيث تم الحصول على الخريطة الطبوغرافية وخريطة الألوان والفسيفساء البانورامية للقمر ، والتي حققت نتائج غير عادية وأرست أساسًا صلبًا للهبوط البشري على سطح القمر. القمر.

    كانت تكلفة المعالجة مرتفعة إلى حد ما ، مع المعدات الحاسوبية في ذلك العصر. تغير ذلك في السبعينيات ، عندما انتشرت معالجة الصور الرقمية مع توفر أجهزة كمبيوتر وأجهزة مخصصة أرخص. أدى ذلك إلى معالجة الصور في الوقت الفعلي ، لبعض المشكلات المخصصة مثل تحويل معايير التلفزيون . نظرًا لأن أجهزة الكمبيوتر للأغراض العامة أصبحت أسرع ، فقد بدأت في تولي دور الأجهزة المخصصة لجميع العمليات باستثناء العمليات الأكثر تخصصًا والأكثر كثافة في استخدام الكمبيوتر. مع أجهزة الكمبيوتر السريعة ومعالجات الإشارات المتوفرة في العقد الأول من القرن الحادي والعشرين ، أصبحت معالجة الصور الرقمية هي أكثر أشكال معالجة الصور شيوعًا ، وتُستخدم عمومًا لأنها ليست الطريقة الأكثر تنوعًا فحسب ، بل إنها الأرخص أيضًا.

    مستشعرات الصورة
    أساس مستشعرات الصورة الحديثة هو تقنية أشباه الموصلات ذات أكسيد المعادن (MOS) ، والتي نشأت من اختراع MOSFET (ترانزستور تأثير المجال MOS) بواسطة محمد محمد عطا الله و Dawon Kahng في Bell Labs في عام 1959. أدى ذلك إلى تطوير مستشعرات الصورة الرقمية أشباه الموصلات ، بما في ذلك الجهاز المقترن بالشحن (CCD) ولاحقًا مستشعر CMOS .

    تم اختراع الجهاز المقترن بالشحن بواسطة Willard S. Boyle و George E. Smith في Bell Labs في عام 1969. أثناء البحث عن تقنية MOS ، أدركوا أن الشحنة الكهربائية هي تشبيه للفقاعة المغناطيسية وأنه يمكن تخزينها في مكثف موس صغير MOS . نظرًا لأنه كان من السهل جدًا تصنيع سلسلة من مكثفات MOS على التوالي ، فقد قاموا بتوصيل جهد مناسب لهم بحيث يمكن نقل الشحنة من واحد إلى التالي. CCD عبارة عن دائرة شبه موصلة تم استخدامها لاحقًا في أول كاميرات فيديو رقمية من أجل البث التلفزيوني .

    NMOSمستشعر البكسل النشط ( APS) بواسطة أوليمبوس في اليابان خلال منتصف الثمانينيات. تم تمكين ذلك من خلال التقدم في تصنيع جهاز أشباه الموصلات MOS ، مع قياس MOSFET يصل إلى أصغر ميكرون ثم المستويات الفرعية . تم تصنيع NMOS APS بواسطة فريق Tsutomu Nakamura في أوليمبوس في عام 1985. تم تطوير مستشعر CMOS بكسل نشط (مستشعر CMOS) لاحقًا بواسطة Eric Fossum في NASA مختبر الدفع النفاث في عام 1993. بحلول عام 2007 ، تجاوزت مبيعات مستشعرات CMOS مستشعرات CCD.

    ضغط الصورة
    تطور مهم في النظام الرقمي كانت تقنية ضغط الصورة هي تحويل جيب التمام المنفصل (DCT) ، وهي تقنية ضغط ضياع اقترحها لأول مرة ناصر أحمد في عام 1972. أصبح ضغط DCT هو الأساس لـ JPEG ، والذي تم تقديمه بواسطة Joint Photographic Experts Group في عام 1992. يضغط JPEG الصور إلى أحجام ملفات أصغر بكثير ، وأصبح تنسيق ملفات الصور الأكثر استخدامًا على إنترنت . كانت خوارزمية ضغط DCT عالية الكفاءة مسؤولة إلى حد كبير عن الانتشار الواسع للصور الرقمية و الصور الرقمية ، مع عدة مليارات صورة JPEG يتم إنتاجها يوميًا اعتبارًا من عام 2015.

    تم إحداث ثورة في معالج الإشارات الرقمية (DSP)
    معالجة الإشارات الإلكترونية من خلال الاعتماد الواسع لتقنية MOS في السبعينيات. الدوائر المتكاملة MOS التكنولوجيا كان أساسًا لأول معالج أحادي الرقاقة معالجات دقيقة و متحكمات دقيقة في أوائل السبعينيات ، ثم أول معالج إشارة رقمي رقاقة واحدة (DSP) في أواخر السبعينيات. منذ ذلك الحين ، تم استخدام شرائح DSP على نطاق واسع في معالجة الصور الرقمية. الشركات التي تطور رقائق DSP بناءً على تقنية DCT. تستخدم DCTs على نطاق واسع لترميز ، فك التشفير ، ترميز الفيديو ، ترميز الصوت ، مضاعفة الإرسال ، إشارات التحكم ، تشوير ، التحويل التناظري إلى الرقمي ، التنسيق النصوع واختلافات الألوان ، وتنسيقات الألوان مثل YUV444 و YUV411 . تُستخدم DCTs أيضًا لعمليات التشفير مثل تقدير الحركة ، تعويض الحركة ، توقع الإطار الداخلي ، التكمية ، الترجيح الإدراكي ، إنتروبيا ترميز ، ترميز متغير ، و متجهات حركة ، وعمليات فك التشفير مثل العملية العكسية بين تنسيقات الألوان المختلفة (YIQ ، YUV و RGB ) لأغراض العرض. تُستخدم DCTs بشكل شائع لرقائق التشفير / فك التشفير التلفزيون عالي الوضوح (HDTV).

    التصوير الطبي
    في عام 1972 ، اخترع المهندس من الشركة البريطانية EMI Housfield جهاز التصوير المقطعي المحوسب بالأشعة السينية لتشخيص الرأس ، وهو ما يسمى عادة التصوير المقطعي المحوسب (CT). تعتمد طريقة نواة التصوير المقطعي المحوسب على إسقاط قسم رأس الإنسان وتتم معالجتها بواسطة الكمبيوتر لإعادة بناء الصورة المقطعية ، وهو ما يسمى إعادة بناء الصورة. في عام 1975 ، نجحت EMI في تطوير جهاز CT لكامل الجسم ، والذي حصل على صورة مقطعية واضحة لأجزاء مختلفة من جسم الإنسان. في عام 1979 ، فازت تقنية التشخيص هذه بجائزة نوبل. تم إدخال تقنية معالجة الصور الرقمية للتطبيقات الطبية في مؤسسة الفضاء قاعة مشاهير تكنولوجيا الفضاء في 1994.

    المهام
    تسمح معالجة الصور الرقمية باستخدام أكثر تعقيدًا بكثير يمكن أن تقدم الخوارزميات ، وبالتالي ، أداءً أكثر تعقيدًا في المهام البسيطة ، وتنفيذ الأساليب التي ستكون مستحيلة بالوسائل التناظرية.

    على وجه الخصوص ، تعد المعالجة الرقمية للصور تطبيقًا ملموسًا وتقنية عملية تستند إلى:

    التصنيف
    استخراج الميزة
    تحليل الإشارة متعدد المقاييس
    التعرف على الأنماط
    الإسقاط
    تتضمن بعض التقنيات المستخدمة في معالجة الصور الرقمية:

    الانتشار متباين الخواص
    نماذج ماركوف المخفية
    استعادة الصورة
    تحليل المكونات المستقلة
    التصفية الخطية
    الشبكات العصبية
    المعادلات التفاضلية الجزئية
    Pixelation
    مطابقة ميزة النقطة
    تحليل المكونات الرئيسية
    الخرائط ذاتية التنظيم
    Wavelets
    تحويلات الصورة الرقمية
    تصفية
    رقمية تُستخدم المرشحات لطمس الصور الرقمية وصقلها. يمكن إجراء التصفية عن طريق:

    الالتفاف مع نواة مصممة خصيصًا (صفيف مرشح) في المجال المكاني
    إخفاء مناطق تردد معينة في مجال التردد (فورييه)
    توضح الأمثلة التالية كلا الطريقتين:

    نوع الفلتر Kernel أو Mask مثال
    الصورة الأصلية [0 0 0 0 1 0 0 0 0] {\ displaystyle {\ begin {bmatrix} 0 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \ end {bmatrix}}}
    ممر منخفض مكاني 1 9 × [1 1 1 1 1 1 1 1] {\ displaystyle {\ frac { 1} {9}} \ times {\ begin {bmatrix} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 1 \ end {bmatrix}}}
    الممر العلوي المكاني [0 - 1 0 - 1 4 - 1 0 - 1 0 ] {\ displaystyle {\ begin {bmatrix} 0 & -1 & 0 \\ - 1 & 4 & -1 \\ 0 & -1 & 0 \ end {bmatrix}}}
    Fourier Representation Pseudo-code:
    image = checkerboard

    F = تحويل فورييه للصورة

    إظهار الصورة: السجل (1 + القيمة المطلقة (F))


    Fourier Lowpass
    Fourier Highpass
    حشوة الصورة في تصفية مجال Fourier
    عادة ما تكون الصور مبطنة قبل أن يتم تحويلها إلى في مساحة فورييه ، توضح الصور التي تمت تصفيتها بمرور مرتفع أدناه نتائج تقنيات الحشو المختلفة:

    مبطن صفري مبطّن بالحافة المتكررة

    لاحظ أن مرشح التمرير العالي يظهر حوافًا إضافية عند الصفر مبطن مقارنة بالحافة المتكررة.

    أمثلة كود التصفية
    مثال MATLAB لتصفية المجال المكاني العالي.

    img = رقعة الداما (20) ؛ ٪ إنشاء لوحة الداما٪ **************************** المجال المكاني ****************** ********* كلابلاس = [0 -1 0 ؛ -1 5 -1 ؛ 0-1 0] ؛ نواة مرشح Laplacian X = conv2 (img، klaplace) ؛ ٪ convolve test img مع٪ 3x3 Laplacian kernel figure () imshow (X،)٪ show Laplacian filtered title ('Laplacian Edge Detection')
    تحويلات التقريب
    تحويلات التقريب تتيح تحويلات الصورة الأساسية بما في ذلك التدوير والتدوير ، ترجم ، انعكاس وقص كما هو موضح في الأمثلة التالية:

    اسم التحويل Affine Matrix مثال
    الهوية [1 0 0 0 1 0 0 0 1] {\ displaystyle {\ begin {bmatrix} 1 & 0 & 0 \ 0 & 1 & 0 \ 0 & 0 & 1 \ end {bmatrix}}}
    الانعكاس [- 1 0 0 0 1 0 0 0 1] {\ displaystyle {\ begin {bmatrix} -1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \ end {bmatrix}}}
    مقياس [cx = 2 0 0 0 cy = 1 0 0 0 1] {\ displaystyle {\ begin {bmatrix} c_ {x} = 2 & 0 & 0 \\ 0 & c_ {y} = 1 & 0 \\ 0 & 0 & 1 \ end {bmatrix}}}
    تدوير [cos ⁡ (θ) sin ⁡ (θ) 0 - sin ⁡ (θ) cos ⁡ (θ) 0 0 0 1] {\ displaystyle {\ begin {bmatrix} \ cos (\ theta) & \ sin (\ theta) & 0 \ - \ sin (\ theta) & cos (\ theta) & 0 \ 0 & 0 & 1 \ end {bmatrix}}} حيث θ = π / 6 = 30 °
    القص [1 cx = 0.5 0 cy = 0 1 0 0 0 1] {\ di splaystyle {\ begin {bmatrix} 1 & c_ {x} = 0.5 & 0 \\ c_ {y} = 0 & 1 & 0 \\ 0 & 0 & 1 \ end {bmatrix}}}
    لتطبيق المصفوفة الأفينية على صورة ، يتم تحويل الصورة إلى مصفوفة حيث يتوافق كل إدخال مع كثافة البكسل في ذلك الموقع. ثم يمكن تمثيل موقع كل بكسل كمتجه يشير إلى إحداثيات ذلك البكسل في الصورة ، [x ، y] ، حيث x و y هما صف وعمود البكسل في مصفوفة الصورة. يسمح هذا بضرب الإحداثيات بمصفوفة تحويل أفيني ، مما يعطي الموضع الذي سيتم نسخ قيمة البكسل إليه في صورة الإخراج.

    ومع ذلك ، للسماح بالتحولات التي تتطلب تحويلات ترجمة ، هناك حاجة إلى إحداثيات متجانسة ثلاثية الأبعاد . عادةً ما يتم تعيين البعد الثالث على ثابت غير صفري ، عادةً 1 ، بحيث يكون الإحداثي الجديد هو [x ، y ، 1]. يسمح ذلك بضرب متجه الإحداثيات في مصفوفة 3 × 3 ، مما يتيح إزاحة الترجمة. لذا فإن البعد الثالث ، وهو الثابت 1 ، يسمح بالترجمة.

    نظرًا لأن مضاعفة المصفوفة ترابطية ، يمكن دمج تحويلات أفينية متعددة في تحويل أفيني واحد عن طريق ضرب مصفوفة كل تحويل فردي بالترتيب الذي تتم به التحويلات. ينتج عن هذا مصفوفة واحدة تعطي ، عند تطبيقها على متجه نقطي ، نفس النتيجة مثل جميع التحويلات الفردية التي يتم إجراؤها على المتجه [x ، y ، 1] بالتسلسل. وبالتالي يمكن اختزال سلسلة من مصفوفات التحويل الأفيني إلى مصفوفة تحويل أفيني واحدة.

    على سبيل المثال ، الإحداثيات ثنائية الأبعاد تسمح فقط بالتناوب حول الأصل (0 ، 0). ولكن يمكن استخدام الإحداثيات المتجانسة ثلاثية الأبعاد لترجمة أي نقطة أولاً إلى (0 ، 0) ، ثم إجراء الدوران ، وأخيراً ترجمة الأصل (0 ، 0) إلى النقطة الأصلية (عكس الترجمة الأولى). يمكن دمج هذه التحولات الثلاثة في مصفوفة واحدة ، مما يسمح بالتناوب حول أي نقطة في الصورة.

    التطبيقات
    صور الكاميرا الرقمية
    تشتمل الكاميرات الرقمية بشكل عام على رقمية متخصصة أجهزة معالجة الصور - إما شرائح مخصصة أو دوائر مضافة على شرائح أخرى - لتحويل البيانات الأولية من مستشعر الصورة إلى صورة مصححة بالألوان بتنسيق ملف صورة قياسي
    التاريخ
    العديد من تقنيات معالجة الصورة الرقمية ، أو معالجة الصور الرقمية كما كانت تسمى غالبًا ، تم تطويرها في الستينيات ، في مختبرات بيل ، مختبر الدفع النفاث ، معهد ماساتشوستس للتكنولوجيا ، جامعة ميريلاند ، وعدد قليل من مرافق البحث الأخرى ، مع تطبيق صور القمر الصناعي ، صورة سلكية تحويل المعايير ، التصوير الطبي ، هاتف مرئي ، التعرف على الأحرف ، وتحسين الصورة. كان الغرض من معالجة الصور المبكرة هو تحسين جودة الصورة. كان يهدف للبشر لتحسين التأثير البصري للناس. في معالجة الصور ، يكون الإدخال صورة ذات جودة منخفضة ، والمخرج هو صورة ذات جودة محسنة. تتضمن معالجة الصور الشائعة تحسين الصورة والاستعادة والتشفير والضغط. كان أول تطبيق ناجح هو مختبر الدفع النفاث الأمريكي (JPL). استخدموا تقنيات معالجة الصور مثل التصحيح الهندسي ، وتحويل التدرج ، وإزالة الضوضاء ، وما إلى ذلك على آلاف الصور القمرية التي أرسلها Space Detector Ranger 7 في عام 1964 ، مع مراعاة موقع الشمس وبيئة القمر. كان تأثير التعيين الناجح لخريطة سطح القمر بواسطة الكمبيوتر نجاحًا كبيرًا. في وقت لاحق ، تم إجراء معالجة أكثر تعقيدًا للصور على ما يقرب من 100000 صورة أرسلتها المركبة الفضائية ، بحيث تم الحصول على الخريطة الطبوغرافية وخريطة الألوان والفسيفساء البانورامية للقمر ، والتي حققت نتائج غير عادية وأرست أساسًا صلبًا للهبوط البشري على سطح القمر. القمر.

    كانت تكلفة المعالجة مرتفعة إلى حد ما ، مع المعدات الحاسوبية في ذلك العصر. تغير ذلك في السبعينيات ، عندما انتشرت معالجة الصور الرقمية مع توفر أجهزة كمبيوتر وأجهزة مخصصة أرخص. أدى ذلك إلى معالجة الصور في الوقت الفعلي ، لبعض المشكلات المخصصة مثل تحويل معايير التلفزيون . نظرًا لأن أجهزة الكمبيوتر للأغراض العامة أصبحت أسرع ، فقد بدأت في تولي دور الأجهزة المخصصة لجميع العمليات باستثناء العمليات الأكثر تخصصًا والأكثر كثافة في استخدام الكمبيوتر. مع أجهزة الكمبيوتر السريعة ومعالجات الإشارات المتوفرة في العقد الأول من القرن الحادي والعشرين ، أصبحت معالجة الصور الرقمية هي أكثر أشكال معالجة الصور شيوعًا ، وتُستخدم عمومًا لأنها ليست الطريقة الأكثر تنوعًا فحسب ، بل إنها الأرخص أيضًا.

    مستشعرات الصورة
    أساس مستشعرات الصورة الحديثة هو تقنية أشباه الموصلات ذات أكسيد المعادن (MOS) ، والتي نشأت من اختراع MOSFET (ترانزستور تأثير المجال MOS) بواسطة محمد محمد عطا الله و Dawon Kahng في Bell Labs في عام 1959. أدى ذلك إلى تطوير مستشعرات الصورة الرقمية أشباه الموصلات ، بما في ذلك الجهاز المقترن بالشحن (CCD) ولاحقًا مستشعر CMOS .

    تم اختراع الجهاز المقترن بالشحن بواسطة Willard S. Boyle و George E. Smith في Bell Labs في عام 1969. أثناء البحث عن تقنية MOS ، أدركوا أن الشحنة الكهربائية هي تشبيه للفقاعة المغناطيسية وأنه يمكن تخزينها في مكثف موس صغير MOS . نظرًا لأنه كان من السهل جدًا تصنيع سلسلة من مكثفات MOS على التوالي ، فقد قاموا بتوصيل جهد مناسب لهم بحيث يمكن نقل الشحنة من واحد إلى التالي. CCD عبارة عن دائرة شبه موصلة تم استخدامها لاحقًا في أول كاميرات فيديو رقمية من أجل البث التلفزيوني .

    NMOSمستشعر البكسل النشط ( APS) بواسطة أوليمبوس في اليابان خلال منتصف الثمانينيات. تم تمكين ذلك من خلال التقدم في تصنيع جهاز أشباه الموصلات MOS ، مع قياس MOSFET يصل إلى أصغر ميكرون ثم المستويات الفرعية . تم تصنيع NMOS APS بواسطة فريق Tsutomu Nakamura في أوليمبوس في عام 1985. تم تطوير مستشعر CMOS بكسل نشط (مستشعر CMOS) لاحقًا بواسطة Eric Fossum في NASA مختبر الدفع النفاث في عام 1993. بحلول عام 2007 ، تجاوزت مبيعات مستشعرات CMOS مستشعرات CCD.

    ضغط الصورة
    تطور مهم في النظام الرقمي كانت تقنية ضغط الصورة هي تحويل جيب التمام المنفصل (DCT) ، وهي تقنية ضغط ضياع اقترحها لأول مرة ناصر أحمد في عام 1972. أصبح ضغط DCT هو الأساس لـ JPEG ، والذي تم تقديمه بواسطة Joint Photographic Experts Group في عام 1992. يضغط JPEG الصور إلى أحجام ملفات أصغر بكثير ، وأصبح تنسيق ملفات الصور الأكثر استخدامًا على إنترنت . كانت خوارزمية ضغط DCT عالية الكفاءة مسؤولة إلى حد كبير عن الانتشار الواسع للصور الرقمية و الصور الرقمية ، مع عدة مليارات صورة JPEG يتم إنتاجها يوميًا اعتبارًا من عام 2015.

    تم إحداث ثورة في معالج الإشارات الرقمية (DSP)
    معالجة الإشارات الإلكترونية من خلال الاعتماد الواسع لتقنية MOS في السبعينيات. الدوائر المتكاملة MOS التكنولوجيا كان أساسًا لأول معالج أحادي الرقاقة معالجات دقيقة و متحكمات دقيقة في أوائل السبعينيات ، ثم أول معالج إشارة رقمي رقاقة واحدة (DSP) في أواخر السبعينيات. منذ ذلك الحين ، تم استخدام شرائح DSP على نطاق واسع في معالجة الصور الرقمية. الشركات التي تطور رقائق DSP بناءً على تقنية DCT. تستخدم DCTs على نطاق واسع لترميز ، فك التشفير ، ترميز الفيديو ، ترميز الصوت ، مضاعفة الإرسال ، إشارات التحكم ، تشوير ، التحويل التناظري إلى الرقمي ، التنسيق النصوع واختلافات الألوان ، وتنسيقات الألوان مثل YUV444 و YUV411 . تُستخدم DCTs أيضًا لعمليات التشفير مثل تقدير الحركة ، تعويض الحركة ، توقع الإطار الداخلي ، التكمية ، الترجيح الإدراكي ، إنتروبيا ترميز ، ترميز متغير ، و متجهات حركة ، وعمليات فك التشفير مثل العملية العكسية بين تنسيقات الألوان المختلفة (YIQ ، YUV و RGB ) لأغراض العرض. تُستخدم DCTs بشكل شائع لرقائق التشفير / فك التشفير التلفزيون عالي الوضوح (HDTV).

    التصوير الطبي
    في عام 1972 ، اخترع المهندس من الشركة البريطانية EMI Housfield جهاز التصوير المقطعي المحوسب بالأشعة السينية لتشخيص الرأس ، وهو ما يسمى عادة التصوير المقطعي المحوسب (CT). تعتمد طريقة نواة التصوير المقطعي المحوسب على إسقاط قسم رأس الإنسان وتتم معالجتها بواسطة الكمبيوتر لإعادة بناء الصورة المقطعية ، وهو ما يسمى إعادة بناء الصورة. في عام 1975 ، نجحت EMI في تطوير جهاز CT لكامل الجسم ، والذي حصل على صورة مقطعية واضحة لأجزاء مختلفة من جسم الإنسان. في عام 1979 ، فازت تقنية التشخيص هذه بجائزة نوبل. تم إدخال تقنية معالجة الصور الرقمية للتطبيقات الطبية في مؤسسة الفضاء قاعة مشاهير تكنولوجيا الفضاء في 1994.

    المهام
    تسمح معالجة الصور الرقمية باستخدام أكثر تعقيدًا بكثير يمكن أن تقدم الخوارزميات ، وبالتالي ، أداءً أكثر تعقيدًا في المهام البسيطة ، وتنفيذ الأساليب التي ستكون مستحيلة بالوسائل التناظرية.

    على وجه الخصوص ، تعد المعالجة الرقمية للصور تطبيقًا ملموسًا وتقنية عملية تستند إلى:

    التصنيف
    استخراج الميزة
    تحليل الإشارة متعدد المقاييس
    التعرف على الأنماط
    الإسقاط
    تتضمن بعض التقنيات المستخدمة في معالجة الصور الرقمية:

    الانتشار متباين الخواص
    نماذج ماركوف المخفية
    استعادة الصورة
    تحليل المكونات المستقلة
    التصفية الخطية
    الشبكات العصبية
    المعادلات التفاضلية الجزئية
    Pixelation
    مطابقة ميزة النقطة
    تحليل المكونات الرئيسية
    الخرائط ذاتية التنظيم
    Wavelets
    تحويلات الصورة الرقمية
    تصفية
    رقمية تُستخدم المرشحات لطمس الصور الرقمية وصقلها. يمكن إجراء التصفية عن طريق:

    الالتفاف مع نواة مصممة خصيصًا (صفيف مرشح) في المجال المكاني
    إخفاء مناطق تردد معينة في مجال التردد (فورييه)
    توضح الأمثلة التالية كلا الطريقتين:

    نوع الفلتر Kernel أو Mask مثال
    الصورة الأصلية [0 0 0 0 1 0 0 0 0] {\ displaystyle {\ begin {bmatrix} 0 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \ end {bmatrix}}}
    ممر منخفض مكاني 1 9 × [1 1 1 1 1 1 1 1] {\ displaystyle {\ frac { 1} {9}} \ times {\ begin {bmatrix} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 1 \ end {bmatrix}}}
    الممر العلوي المكاني [0 - 1 0 - 1 4 - 1 0 - 1 0 ] {\ displaystyle {\ begin {bmatrix} 0 & -1 & 0 \\ - 1 & 4 & -1 \\ 0 & -1 & 0 \ end {bmatrix}}}
    Fourier Representation Pseudo-code:
    image = checkerboard

    F = تحويل فورييه للصورة

    إظهار الصورة: السجل (1 + القيمة المطلقة (F))


    Fourier Lowpass
    Fourier Highpass
    حشوة الصورة في تصفية مجال Fourier
    عادة ما تكون الصور مبطنة قبل أن يتم تحويلها إلى في مساحة فورييه ، توضح الصور التي تمت تصفيتها بمرور مرتفع أدناه نتائج تقنيات الحشو المختلفة:

    مبطن صفري مبطّن بالحافة المتكررة

    لاحظ أن مرشح التمرير العالي يظهر حوافًا إضافية عند الصفر مبطن مقارنة بالحافة المتكررة.

    أمثلة كود التصفية
    مثال MATLAB لتصفية المجال المكاني العالي.

    img = رقعة الداما (20) ؛ ٪ إنشاء لوحة الداما٪ **************************** المجال المكاني ****************** ********* كلابلاس = [0 -1 0 ؛ -1 5 -1 ؛ 0-1 0] ؛ نواة مرشح Laplacian X = conv2 (img، klaplace) ؛ ٪ convolve test img مع٪ 3x3 Laplacian kernel figure () imshow (X،)٪ show Laplacian filtered title ('Laplacian Edge Detection')
    تحويلات التقريب
    تحويلات التقريب تتيح تحويلات الصورة الأساسية بما في ذلك التدوير والتدوير ، ترجم ، انعكاس وقص كما هو موضح في الأمثلة التالية:

    اسم التحويل Affine Matrix مثال
    الهوية [1 0 0 0 1 0 0 0 1] {\ displaystyle {\ begin {bmatrix} 1 & 0 & 0 \ 0 & 1 & 0 \ 0 & 0 & 1 \ end {bmatrix}}}
    الانعكاس [- 1 0 0 0 1 0 0 0 1] {\ displaystyle {\ begin {bmatrix} -1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \ end {bmatrix}}}
    مقياس [cx = 2 0 0 0 cy = 1 0 0 0 1] {\ displaystyle {\ begin {bmatrix} c_ {x} = 2 & 0 & 0 \\ 0 & c_ {y} = 1 & 0 \\ 0 & 0 & 1 \ end {bmatrix}}}
    تدوير [cos ⁡ (θ) sin ⁡ (θ) 0 - sin ⁡ (θ) cos ⁡ (θ) 0 0 0 1] {\ displaystyle {\ begin {bmatrix} \ cos (\ theta) & \ sin (\ theta) & 0 \ - \ sin (\ theta) & cos (\ theta) & 0 \ 0 & 0 & 1 \ end {bmatrix}}} حيث θ = π / 6 = 30 °
    القص [1 cx = 0.5 0 cy = 0 1 0 0 0 1] {\ di splaystyle {\ begin {bmatrix} 1 & c_ {x} = 0.5 & 0 \\ c_ {y} = 0 & 1 & 0 \\ 0 & 0 & 1 \ end {bmatrix}}}
    لتطبيق المصفوفة الأفينية على صورة ، يتم تحويل الصورة إلى مصفوفة حيث يتوافق كل إدخال مع كثافة البكسل في ذلك الموقع. ثم يمكن تمثيل موقع كل بكسل كمتجه يشير إلى إحداثيات ذلك البكسل في الصورة ، [x ، y] ، حيث x و y هما صف وعمود البكسل في مصفوفة الصورة. يسمح هذا بضرب الإحداثيات بمصفوفة تحويل أفيني ، مما يعطي الموضع الذي سيتم نسخ قيمة البكسل إليه في صورة الإخراج.

    ومع ذلك ، للسماح بالتحولات التي تتطلب تحويلات ترجمة ، هناك حاجة إلى إحداثيات متجانسة ثلاثية الأبعاد . عادةً ما يتم تعيين البعد الثالث على ثابت غير صفري ، عادةً 1 ، بحيث يكون الإحداثي الجديد هو [x ، y ، 1]. يسمح ذلك بضرب متجه الإحداثيات في مصفوفة 3 × 3 ، مما يتيح إزاحة الترجمة. لذا فإن البعد الثالث ، وهو الثابت 1 ، يسمح بالترجمة.

    نظرًا لأن مضاعفة المصفوفة ترابطية ، يمكن دمج تحويلات أفينية متعددة في تحويل أفيني واحد عن طريق ضرب مصفوفة كل تحويل فردي بالترتيب الذي تتم به التحويلات. ينتج عن هذا مصفوفة واحدة تعطي ، عند تطبيقها على متجه نقطي ، نفس النتيجة مثل جميع التحويلات الفردية التي يتم إجراؤها على المتجه [x ، y ، 1] بالتسلسل. وبالتالي يمكن اختزال سلسلة من مصفوفات التحويل الأفيني إلى مصفوفة تحويل أفيني واحدة.

    على سبيل المثال ، الإحداثيات ثنائية الأبعاد تسمح فقط بالتناوب حول الأصل (0 ، 0). ولكن يمكن استخدام الإحداثيات المتجانسة ثلاثية الأبعاد لترجمة أي نقطة أولاً إلى (0 ، 0) ، ثم إجراء الدوران ، وأخيراً ترجمة الأصل (0 ، 0) إلى النقطة الأصلية (عكس الترجمة الأولى). يمكن دمج هذه التحولات الثلاثة في مصفوفة واحدة ، مما يسمح بالتناوب حول أي نقطة في الصورة.

    التطبيقات
    صور الكاميرا الرقمية
    تشتمل الكاميرات الرقمية بشكل عام على رقمية متخصصة أجهزة معالجة الصور - إما شرائح مخصصة أو دوائر مضافة على شرائح أخرى - لتحويل البيانات الأولية من مستشعر الصورة إلى صورة مصححة بالألوان بتنسيق ملف صورة قياسي
يعمل...
X