ترميز البيانات المفقودة في فوركس ستاتا
إشعار: ستقوم مجموعة الاستشارات الإحصائية إدر بترحيل الموقع إلى نظام إدارة المحتوى في وردبريس في فبراير لتسهيل الصيانة وإنشاء محتوى جديد. ستتم إزالة بعض صفحاتنا القديمة أو وضعها في الأرشيف بحيث لا يتم الاحتفاظ بها بعد الآن. سنحاول الحفاظ على عمليات إعادة التوجيه بحيث تستمر عناوين ورل القديمة في العمل بأفضل ما في وسعنا. مرحبا بكم في معهد للبحوث الرقمية والتعليم مساعدة المجموعة الاستشارية ستاتا من خلال إعطاء هدية ستاتا التعليمات كيف يمكنني إعادة رمز القيم المفقودة إلى فئات مختلفة ستاتا يسمح لنا لرمز أنواع مختلفة من القيم المفقودة الرقمية. لديها 27 فئات مفقودة رقمية. كوت. a كوت تو كوت. z كوت أند كوت. مثل. سنعرض في هذه الصفحة كيفية كتابة القيم المفقودة إلى فئات مختلفة. أولا نحن إنشاء مجموعة بيانات لغرض التوضيح. في مجموعة البيانات هذه، جميع المتغيرات رقمية ومتغيرات الإناث و سيس لها قيم مفقودة. القيم غير المفقودة للمتغير الإناث هي 0 (للذكور) و 1 (للإناث). القيم غير المفقودة للمتغير سيس هي 0 (منخفضة)، 1 (ميد) و 2 (عالية). وتعتبر بقية القيم قيما مفقودة. دعونا نقول أننا نريد أن رمز -999 إلى فئة واحدة، -99 إلى آخر وبقية القيم المفقودة إلى فئة ثالثة لجميع المتغيرات. الطريقة الأولى: استخدام الأمر استبدال يمكننا يدويا استبدال القيم المفقودة مع كوت. a كوت ل -999، كوت. b كوت ل -99 و. c لبقية القيم المفقودة. على سبيل المثال، لمتغير الإناث. يمكننا أن نفعل ما يلي: يظهر الأمر كوديبوك أعلاه أن الإناث متغير ثلاثة أنواع من القيم المفقودة و 4 القيم المفقودة. الطريقة 2: استخدام مفديكود الأمر الطريقة 1 قد لا تكون أفضل طريقة لإعادة تعيين القيم المفقودة إلى فئات مختلفة. لشيء واحد، علينا أن نفعل ذلك متغير واحد في وقت واحد. ستاتاس أمر مفديكود يأتي في متناول يدي بالنسبة لنا. والأفضل من ذلك، يمكننا استخدام الكلمة الرئيسية كلها للإشارة إلى جميع المتغيرات في مجموعة البيانات. الانتقال من رموز القيمة المفقودة إلى قيم رقمية المشكلة الأخرى التي سنغطيها هنا هي كيفية تغيير رموز القيمة المفقودة إلى القيم الرقمية. يقترن مفينكود الأمر مع مفديكود الأمر أننا تغطيتها فقط أعلاه وهو واحد لاستخدام هنا. محتوى هذا الموقع لا ينبغي أن يفسر على أنه تأييد لأي موقع ويب معين أو كتاب أو منتج برامج من قبل جامعة كاليفورنيا. ملاحظة: سوف تقوم مجموعة الاستشارات الإحصائية إدر بترحيل الموقع إلى نظام إدارة محتوى وردبريس في فبراير لتسهيل صيانة وإنشاء محتوى جديد. ستتم إزالة بعض صفحاتنا القديمة أو وضعها في الأرشيف بحيث لا يتم الاحتفاظ بها بعد الآن. سنحاول الحفاظ على عمليات إعادة التوجيه بحيث تستمر عناوين ورل القديمة في العمل بأفضل ما في وسعنا. مرحبا بكم في معهد للبحوث الرقمية والتعليم مساعدة مجموعة استشارات الدولة من خلال إعطاء هدية ستاتا وحدة التعلم البيانات المفقودة 1. مقدمة هذه الوحدة سوف استكشاف البيانات المفقودة في ستاتا، مع التركيز على البيانات المفقودة الرقمية. وسوف تصف كيفية الإشارة إلى البيانات المفقودة في ملفات البيانات الخام الخاصة بك، وكذلك كيفية معالجة البيانات المفقودة في أوامر منطقية ستاتا وبيانات التعيين. سوف نقوم بتوضيح بعض خصائص البيانات المفقودة في ستاتا باستخدام بيانات من دراسة وقت رد الفعل مع ثمانية مواضيع أشار إليها المتغير معرف. وقياس زمن التفاعلات في ثلاث نقاط زمنية (trial1 trial2 trial3). يتم عرض ملف بيانات الإدخال أدناه. قد تلاحظ أن بعض أوقات التفاعل مشفرة باستخدام واحد. كما هو الحال بالنسبة للموضوع 2. الشخص الذي يقيس الوقت لتلك المحاكمة لم يقيس وقت الاستجابة بشكل صحيح، وبالتالي فإن البيانات عن المحاكمة الثانية مفقودة. 2. كيف تعالج ستاتا البيانات المفقودة في إجراءات ستاتا كقاعدة عامة، أوامر ستاتا التي تقوم بإجراء حسابات من أي نوع التعامل مع البيانات المفقودة عن طريق حذف القيم المفقودة. ومع ذلك، فإن الطريقة التي يتم حذف القيم المفقودة ليست متسقة دائما عبر الأوامر، لذلك Let39s نلقي نظرة على بعض الأمثلة. أولا، يلخص Let39s متغيرات وقت رد الفعل ونرى كيف ستاتا يعالج القيم المفقودة. كما ترون في الناتج أدناه، تلخيص وسائل محسوبة باستخدام 4 ملاحظات للمحاكمة 1 و trial2 و 6 ملاحظات للمحاكمة 3. وباختصار، أجرى الأمر تلخيص الحسابات على جميع البيانات المتاحة. مثال ثان، يوضح كيف يعالج الأمر تابولاتيون أو tab1 البيانات المفقودة. مثل تلخيص، tab1 يستخدم البيانات المتاحة فقط. ويلاحظ أن النسب المئوية تحسب استنادا إلى العدد الكلي للحالات غير المفقودة. من المحتمل أن تكون قد تم حساب النسب المئوية من إجمالي عدد المشاهدات، والنسبة المئوية مفقودة لكل متغير موضحة في الجدول. ويمكن تحقيق ذلك من خلال تضمين الخيار المفقود بعد الجدولة. الأمر، Let39s ننظر في كيفية معالجة الأمر ارتباط البيانات المفقودة. ونتوقع أن تؤدي الحسابات استنادا إلى البيانات المتاحة، وأن تحذف القيم المفقودة. هنا هو مثال الأمر. الإخراج هو عرض أدناه. لاحظ كيف تم استبعاد القيم المفقودة. سوف ستاتا تنفيذ حذف ليستويز وعرض فقط الارتباط للملاحظات التي لها قيم غير مفقودة على كافة المتغيرات المدرجة. ستاتا كما يسمح لحذف زوجي. يتم عرض الارتباطات للملاحظات التي لها قيم غير مفقودة لكل زوج من المتغيرات. يمكن القيام بذلك باستخدام الأمر بوكور. نحن نستخدم الخيار أوبس لعرض عدد من الملاحظات المستخدمة لكل زوج، كما ترون، فإنها تختلف اعتمادا على كمية المفقودين. 3. ملخص لكيفية معالجة القيم المفقودة في إجراءات ستاتا تلخيص لكل متغير، يتم استخدام عدد القيم غير المفقودة. الجدولة افتراضيا، يتم استبعاد القيم المفقودة وتستند النسب المئوية على عدد القيم غير المفقودة. إذا كنت تستخدم الخيار المفقود في أمر علامة التبويب، تستند النسب المئوية إلى إجمالي عدد المشاهدات (غير المفقودة والمفقودة) والنسبة المئوية للقيم المفقودة مذكورة في الجدول. كور افتراضيا، يتم حساب الارتباطات استنادا إلى عدد الأزواج مع البيانات غير المفقودة (حذف زوجي للبيانات المفقودة). يمكن استخدام الأمر بوكور لطلب أن يتم حساب الارتباطات فقط للملاحظات التي تحتوي على بيانات غير مفقودة لجميع المتغيرات المدرجة بعد أمر بوكور (حذف قائمة البيانات المفقودة). ريج إذا كان أي من المتغيرات المدرجة بعد أمر ريج مفقودا، فإن الملاحظات التي تفتقد تلك القيمة (القيم) مستبعدة من التحليل (أي حذف قائمة البيانات المفقودة). للحصول على إجراءات أخرى، راجع دليل ستاتا للحصول على معلومات حول كيفية معالجة البيانات المفقودة. 4. القيم المفقودة في بيانات التخصيص من المهم أن نفهم كيف يتم التعامل مع القيم المفقودة في بيانات التخصيص. فكر في المثال الموضح أدناه. يوضح أمر القائمة أدناه كيفية معالجة القيم المفقودة في عبارات التعيين. ويستند المتغير sum1 على المتغيرات trial1 trial2 و trial3. إذا كان أي من هذه المتغيرات مفقودة، فقد تم تعيين قيمة المجموع 1 على المفقودين. ولذلك فإن القيمة 1 مفقودة للملاحظات 2 و 3 و 4، كما هو الحال بالنسبة للملاحظة 7. وكقاعدة عامة، فإن الحسابات التي تنطوي على قيم مفقودة تعطي قيم مفقودة. على سبيل المثال، 2 2 ينتج 4 2. عائدات . 2 2 الغلة 1. 2 الغلة. 2 3 الغلة 6 2. عائدات . كلما قمت بإضافة، طرح، ضرب، تقسيم، الخ القيم التي تنطوي على البيانات المفقودة، والنتيجة مفقودة. في تجربة وقت رد الفعل لدينا، مجموع الوقت رد الفعل 1 مفقود لأربع من أصل سبع حالات. يمكننا محاولة تجميع البيانات للمحاكمات غير المفقودة باستخدام الدالة روتوتال كما هو موضح في المثال أدناه. تظهر النتائج أدناه أن المجموع 2 يحتوي الآن على مجموع التجارب غير المفقودة. لاحظ أن الدالة روتوتال يعامل مفقود كقيمة صفر. عند جمع عدة متغيرات قد لا يكون من المعقول معالجة المفقودين على أنه صفر إذا كانت الملاحظات مفقودة على جميع المتغيرات التي سيتم تلخيصها. الدالة روتوتال مع الخيار المفقود سيعود قيمة مفقودة إذا كانت الملاحظة مفقودة على جميع المتغيرات. وهناك بيانات أخرى تعمل بالمثل. على سبيل المثال، لاحظ ما حدث عندما نحاول إنشاء متغير متوسط دون استخدام وظيفة (كما هو موضح في المثال أدناه). إذا كان أي من المتغيرات trial1، trial2 أو trial3 مفقودة، يتم تعيين قيمة avg1 إلى مفقودة. بدلا من ذلك، الدالة رومين متوسط البيانات للمحاكمات غير المفقودة في نفس طريقة الدالة روتوتال. ملاحظة: لو كان هناك عدد كبير من التجارب، ويقول 50 المحاكمات، ثم سيكون مزعج أن يكون لكتابة أفغرومان (المحاكمة 1 trial2 trial3 المحاكمة 4). هنا هو اختصار يمكنك استخدامه في هذا النوع من الوضع: وأخيرا، يمكنك استخدام روميس و رونوميس وظائف لتحديد عدد المفقودين وعدد من القيم غير المفقودة، على التوالي، في قائمة المتغيرات. وهذا موضح أدناه. للمتغير نوميس. كان للملاحظات 1 و 5 و 6 ثلاث قيم صحيحة، وكان للملاحظتين 2 و 3 قيمتان صحيحتان، وكانت الملاحظة 4 ذات قيمة صحيحة واحدة فقط ولم تكن للمراقبة 7 قيم صالحة. المتغير يغيب يظهر العكس، فإنه يوفر عدد من عدد من القيم المفقودة. 5. القيم المفقودة في البيانات المنطقية من المهم أن نفهم كيف يتم التعامل مع القيم المفقودة في التصريحات المنطقية. على سبيل المثال، قل أنك تريد إنشاء متغير 01 ل trial1 1 إذا كان 1.5 أو أقل و 0 إذا كان أكثر من 1.5. نعرض هذا أدناه (بشكل غير صحيح، كما سترى). يبدو أن شيئا ما حدث خطأ مع متغيرنا الجديد الذي أنشأ حديثا newvar1. تم تعيين الملاحظات مع القيم المفقودة ل trial2 صفر ل newvar1. Let39s استكشاف لماذا حدث هذا من خلال النظر في جدول التردد من trial2. كما ترون في الإخراج، والقيم المفقودة هي في المدرجة بعد أعلى قيمة 2.1 وذلك لأن ستاتا يعامل قيمة مفقودة كأكبر قيمة ممكنة (على سبيل المثال اللانهاية الإيجابية) وهذه القيمة أكبر من 2.1، وبالتالي فإن القيم ل newvar1 يصبح 0. الآن بعد أن نفهم كيف ستاتا يعامل القيم المفقودة، وسوف نستبعد صراحة القيم المفقودة للتأكد من أنها تعامل بشكل صحيح، كما هو مبين أدناه. كما ترون في الناتج ستاتا أدناه، متغير newvar2 الجديد لديه قيم مفقودة للملاحظات التي هي أيضا مفقودة ل trial2. 6. القيم المفقودة في التصريحات المنطقية عند إنشاء أو إعادة ترميز المتغيرات التي تتضمن قيم مفقودة، يجب الانتباه دائما إلى ما إذا كان المتغير يتضمن قيم مفقودة أم لا. 7. لمزيد من المعلومات لا ينبغي أن يفسر محتوى هذا الموقع على أنه تأييد لأي موقع على شبكة الإنترنت، كتاب، أو منتج البرمجيات من قبل جامعة كاليفورنيا.
Comments
Post a Comment