Monday 22 January 2018

ستاتا 12 المتوسط المتحرك


مرحبا بكم في معهد للبحوث الرقمية والتعليم المتكررة تحليل التدابير مع البيانات الحسابية: واسعة ضد التدابير المتكررة طويلة البيانات يأتي في شكلين مختلفين: 1) واسعة أو 2) لفترة طويلة. في شكل واسع يظهر كل موضوع واحد مع التدابير المتكررة في نفس الملاحظة. بالنسبة للبيانات في شكل طويل وهناك ملاحظة واحدة لكل فترة زمنية لكل موضوع. هنا مثال من البيانات في شكل واسع لأربع فترات زمنية. في Y1 أعلاه هو متغير الاستجابة في وقت واحد. في الشكل الطويل تبدو البيانات مثل هذا. لاحظ أن الوقت هو متغير صريح مع بيانات النموذج طويلة. ويسمى هذا الشكل البيانات الشخص الفترة من قبل بعض الباحثين. الحسابية يحلل التدابير المتكررة لكلا أنوفا ونماذج مختلطة الخطية في شكل طويل. من ناحية أخرى، SAS و SPSS عادة تحليل أنوفا قياس المتكرر في شكل واسع. ومع ذلك، على حد سواء SAS و SPSS تتطلب بيانات طويلة استخدام نماذج مختلطة. على سبيل المثال بيانات مثالنا بيانات يسمى بذكاء التدابير المتكررة والتي يمكن تحميلها مع الأمر التالي. هناك ما مجموعه ثمانية موضوعات قياس في أربع نقاط الوقت لكل منهما. هذه البيانات في شكل واسع حيث Y1 هو الرد في وقت 1، Y2 هو الرد في وقت 2، وهلم جرا. وتنقسم المواد إلى مجموعتين من أربع مواد باستخدام حزب تاى راك تاى المتغير. وفيما يلي إحصاءات وصفية الأساسية في كل نقطة من النقاط الزمنية الأربعة مجتمعة، وكسر من قبل مجموعة العلاج. المقبل، ونحن سوف رسم بياني لخلية ثمانية تعني مع المستخدم مكتوبة الأوامر، profileplot. يمكنك تحميل هذا الأمر عن طريق كتابة profileplot findit هو إطار الأوامر الحسابية. الآن، دعونا ننظر في الارتباط والتغاير مصفوفات من الردود على مر الزمن. يفترض المتكررة أنوفا قياس هيكل التغاير داخل تخضع متماثل مركب. مصفوفة التغاير أعلاه لا يبدو أن لديها التماثل المجمع. سنناقش داخل موضوع التغاير بمزيد من التفصيل لاحقا في العرض التقديمي. إعادة تشكيل من واسع لفترة طويلة والآن بعد أن اطلعنا على بعض الإحصاءات الوصفية يمكننا إعادة تشكيل البيانات في شكل طويل باستخدام الأمر إعادة تشكيل. الخيار الأول () يعطي المتغير الذي يحدد هذا الموضوع في حين خيار ي () بإنشاء متغير جديد يشير إلى الفترة الزمنية. والآن ونحن أعادت تشكيل البيانات يمكننا أن ننتقل إلى التدابير المتكررة أنوفا. تدابير المتكررة أنوفا في أنوفا لغة هذا التصميم على حد سواء بين-الموضوع وداخل موضوع الآثار، أي هو نموذج الآثار مختلطة. على وجه الخصوص يشار هذا التصميم في بعض الأحيان على أنها تحليل انقسام مؤامرة مضروب من التباين. في الحسابية، مع البيانات في شكل طويل، ونحن بحاجة إلى تحديد شروط خطأ لكل من آثار بين الخاضعة وداخل الموضوع. بشكل عام، والقاعدة هي أن هناك واحدة مصطلح خطأ واحد لجميع الآثار بين-الموضوع ومصطلح خطأ منفصل لكل من العوامل داخل الموضوع ولتفاعل عوامل داخل الموضوع. لدينا النموذج هو نسبيا على التوالي إلى الأمام مع الشروط خطأ اثنين فقط. تأثير بين-الموضوع هو العلاج (TRT) والمدى خطئه يخضع متداخلة في المعاملة (معرف TRT). وداخل تخضع الوقت عامل الوقت. مصطلح الخطأ منه هو الخطأ المتبقي للنموذج. تدابير المتكررة أنوفا لها افتراض أن الهيكل التغاير داخل الموضوع هو متماثل مركب، المعروف أيضا باسم، صرف. مع التماثل مركب من المتوقع الفروق في كل مرة لتكون على قدم المساواة، ويتوقع أن تكون مساوية لبعضها البعض كل من التغايرات. إذا كانت بنية التغاير داخل الموضوع ليس متماثل مركب ثم القيم ص الحصول عليها من تدابير أنوفا المتكررة قد لا تعكس بدقة الاحتمالات الحقيقية. الحسابية السماح الصورة كنت تأخذ من عدم التماثل مجمع بعين الاعتبار من قبل بما في ذلك خيار المتكررة () في الأمر أنوفا الذي يحسب ف قيم المحافظة F-الاختبارات. سنناقش الهياكل التغاير بمزيد من التعمق في وقت لاحق في العرض التقديمي. هنا هو الأمر أنوفا لبياناتنا. التفاعل المعاملة على أيدي الوقت مهم كما نوعان من الآثار الرئيسية لتلقي العلاج والوقت. يتضمن الإخراج القيم ص لمدة ثلاثة مختلفة المحافظة F-الاختبارات: 1) هيونه-فلت، 2) الاحتباس الحراري-Geisser و3) صندوق ف. المحافظين هذه القيم هي مؤشرات للقيمة احتمالية وحتى إذا كانت البيانات لا تلبية افتراض مجمع التماثل. يمكننا عرض مجمعة داخل موضوع التغاير مصفوفة من خلال سرد مصفوفة SREP. التفتيش على تجميع داخل موضوع مصفوفة تغاير يلقي بظلال من الشك على صحة الافتراض مجمع التماثل. لحسن الحظ، والقيم ص لمحافظ F-اختبار لا تزال تشير إلى تأثيرات كبيرة على التفاعل في الوقت حزب تاى راك تاى والأثر الرئيسي الوقت. اختبارات آثار بسيطة منذ التفاعل المعاملة على أيدي الوقت مهم علينا أن نحاول تفسير تفاعل. طريقة واحدة للقيام بذلك هي من خلال استخدام اختبار آثار بسيطة. سنبدأ من خلال النظر في تأثير الوقت على كل مستوى العلاج. تأثير الوقت في كل معاملة تأثير بسيط من الوقت ثلاث درجات الحرية لكل مستوى من العلاج ليصبح المجموع ستة درجات الحرية. وهذا الاختبار من آثار بسيطة تستخدم الخطأ المتبقية لنموذج كمصطلح خطئه. سوف نستخدم الأمر على النقيض من قيام بهذا الاختبار من آثار بسيطة. زوجيا المتابعات وبما أن كل من الاختبارات من آثار بسيطة تتضمن أربع نقاط الوقت سوف يتابع مع مقارنات البشرى باستخدام الأمر هوامش مع خيار pwcompare. أنوفا مع حد الخطأ المجمعة الاختبارات من العلاج في كل نقطة التعادل تتطلب استخدام الخطأ المجمعة. وهذا يعني، تجميع حزب تاى راك تاى الهوية والخطأ المتبقية. ويتم إنجاز هذا بسهولة عن طريق إزالة معرف حزب تاى راك تاى من الأمر أنوفا. لاحظ أن درجة المتبقية من الحرية هي الآن 24. تأثير العلاج في كل مرة ونحن الآن يمكن تشغيل آثار بسيطة من العلاج في كل مرة، ومرة ​​أخرى باستخدام الأمر على النقيض. وبما أن هناك مستويين من العلاج في كل نقطة زمنية هناك ما مجموعه أربع درجات من الحرية. وبما أن كل اختبار هو درجة واحدة من الحرية، ونحن لم يكن لديك للقيام بأي متابعة الاختبارات. الرسم البياني للتفاعل رسم بياني من التفاعل المفيد دائما. سوف نستخدم الأمر الهوامش وmarginsplot لإنتاج هذه المؤامرة. مساوئ التدابير المتكررة أنوفا المتكررة التدابير أنوفا يعاني من عيوب عديدة من بينها، لا يسمح الملاحظات غير متكافئة ضمن المستعمل الموضوع يجب تحديد الصحيح حد الخطأ لكل أثر يفترض التماثل مركب / صرف هيكل التغاير التدابير المتكررة النموذج المختلط بديل لتدابير المتكررة أنوفا هو لتشغيل تحليل بمثابة تدابير المتكررة نموذج مختلطة. ونحن سوف نفعل ذلك باستخدام الأمر xtmixed. لاحظ أننا لم يكن لديك لتحديد شروط خطأ، ونحن بحاجة فقط لتحديد اسم المتغير الذي يتم تكرار البيانات، في هذه الحالة الهوية. هنا هو ما يبدو الأمر xtmixed مثل. ملاحظة، ونحن نستخدم الخيار REML ذلك فإن النتائج ستكون مماثلة لنتائج أنوفا. بالإضافة إلى تقديرات الآثار الثابتة نحصل على اثنين من الآثار العشوائية. هذه هي التباين وقراءتها والفرق المتبقية التي تتوافق مع بين الموضوع و-في-موضوع الفروق على التوالي. xtmixed تنتج التقديرات لكل مصطلح في نموذج على حدة. للحصول على اختبارات مشتركة (درجة متعددة الحرية) من التفاعل والآثار الرئيسية سوف نستخدم الأمر على النقيض. الرسم البياني للتفاعل دعونا الصورة الرسم البياني التفاعل باستخدام نفس الهوامش وأوامر marginsplot كما كان من قبل. اختبار آثار بسيطة ومرة ​​أخرى، يمكننا استخدام اختبارات آثار بسيطة لفهم تفاعل كبير. الوقت في كل معاملة وبما أن كل هذه التجارب من آثار بسيطة يستخدم ثلاث درجات من الحرية، ونحن سوف متابعة usinf مقارنة، بحث. ان العلاج في كل وقت الاختبار بعد خاص للاتجاهات وهناك طريقة أخرى للنظر إلى هذه النتائج ستكون للنظر في هذا الاتجاه مع مرور الوقت لكل من المجموعتين. ونحن نفعل ذلك باستخدام ص. مشغل النقيض مما يعطي معاملات استخدام كثيرات الحدود المتعامدة. علينا أن نحافظ على المشغل أن كنا في الاختبارات من آثار بسيطة لإعطاء النتائج والعلاج. أظهرت النتائج اتجاه خطي كبير لكل من العلاج 1 والعلاج 2. علاج 2 لديه اتجاه التربيعية كبير بينما العلاج 1 لديها اتجاه مكعب كبير. اختبار ما بعد مخصصة للتفاعل جزئي ولكن بديل آخر هو أن ننظر إلى تفاعلات جزئية بين العلاج والوقت. ونحن سوف ننظر في اثنين من العلاجات ونقطتين الوقت لكل اختبار. لفهم تجاربنا التفاعل الجزئي فإنه يساعد على عرض الرسم البياني للتفاعل. يبدو أول اختبار في خطين بين الساعة 1 و 2. وقت تبدو الاختبار التالي في الخطوط الفاصلة بين الساعة 2 و 3. وقت و، يبدو الاختبار النهائي في خطين بين الساعة 3 و 4. وقت لكل من تفاعلات جزئية نحن اختبار إذا كان التفاعل بين الخلايا أربعة مهم. الطريق إلى إعداد الاختبارات التفاعل الجزئي هو استخدام أ. (المجاور) المشغل النقيض مع للتفاعل. التفسير هو أكثر تعقيدا من هذا المفهوم. وتشير النتائج إلى أنه لا يوجد أي تفاعل بين الساعة 1 و 2 الوقت أو بين الساعة 2 و 3. وقت ومع ذلك، هناك تفاعل بين الساعة 3 و 4. في غضون الخاضعة الهياكل التغاير نحن ذكرنا سابقا أننا سوف نعود إلى هذا الموضوع من داخل الموضوع الهياكل التغاير. لذا، دعونا ننظر في العديد من الهياكل التغاير الممكنة داخل الموضوع. هذا الهيكل التغاير يعامل الآثار المتكررة بأنها مستقلة تماما، تماما كما لو كان التصميم بين-الموضوعات. مجمع التماثل / صرف المتكررة التدابير أنوفا يفترض أن هيكل التغاير داخل الموضوع قد تماثل مركب. هناك فرق واحد (1) لكل من أزواج من المحاكمات. ويتضح ذلك أدناه. الحسابية يدعو هذا الهيكل التغاير صرف. غير منظم لالتغاير غير منظم كل نقطة زمنية لديها فرق خاصة بها (مثل 21 هو التغاير من الزمن 1 والوقت 2). هذا يتم العثور على نوع من هيكل التغاير التحليل متعدد المتغيرات من التباين المتعدد. الجانب السلبي لاستخدام التغاير غير منظم هو أكبر عدد من المعايير التي يجري المقدرة. الانحدار آخر هيكل التغاير المشترك الذي كثيرا ما لوحظ في بيانات التدابير المتكررة هو هيكل الانحدار، الذي يقر بأن الملاحظات التي هي أكثر قربا أكثر المترابطة من التدابير التي هي أكثر بعدا. فيما يلي مثال لمصفوفة تغاير الانحدار 1. ومن الممكن أيضا أن لديها هياكل الانحدار 2 أو 3 نوع. بالإضافة إلى الهياكل التغاير هو مبين أعلاه، الحسابية كما يقدم الهياكل التغاير التالية: المتوسط ​​المتحرك، النطاقات، toeplitz والأسي. المثال مع التغاير غير منظم وبعد تفتيش لدينا في غضون الخاضعة مصفوفة التغاير، قررنا استخدام غير منظم التغاير داخل الموضوع. هنا هو المفصل (درجة متعددة الحرية) اختبار للتفاعل. اختبارات آثار بسيطة: الوقت TRT منذ التفاعل مهم إحصائيا سنتابع مع اختبار آثار بسيطة من الوقت في كل معاملة. نماذج النمو الخطي نموذج النمو ومن الممكن أيضا لعلاج الوقت كمتغير مستمر، وفي هذه الحالة، يعتبر النموذج ليكون نموذج النمو الخطي. لتبسيط تفسير اعتراض نحن نذهب إلى وقت البدء من الصفر بدلا من واحدة. ونحن نفعل ذلك من خلال خلق ctime متغير جديد وهو الوقت - 1. ونحن بحاجة للسماح xtmixed نعلم أننا نتعامل ctime كما المستمر باستخدام ج. بادئة. ملاحظة عند استخدام النموذج المختلط أنه ليس من الضروري لكل مادة المراد قياسها عند نقاط نفس الوقت على الرغم من أن في حالتنا أنها تقاس فقط في نفس الوقت أربع نقاط. هنا هو نموذج النمو الخطي لدينا. كما ترون على المدى التفاعل لا تزال ذات دلالة إحصائية. عليك أن تكون حذرا حول تفسير حزب تاى راك تاى وctime عن الآثار الرئيسية بالمعنى أنوفا. معامل ctime هو المنحدر من y على ctime في المجموعة المرجعية. في حين أن معامل للحزب تاى راك تاى هو الفرق في المجموعتين عندما ctime صفر. منحدرات بسيطة يمكننا استخدام الأمر هوامش مع خيار dydx للحصول على سفوح كل من مجموعات العلاج اثنين. لاحظ أن المنحدر لحزب تاى راك تاى 1 هو نفس معامل للctime أعلاه. يمكننا أيضا اختبار الفرق في المنحدرات باستخدام الأمر هوامش مع مجموعة مرجعية الترميز باستخدام ص. على النقيض من المشغل. وليس من الضروري حقا أن تفعل هذا لأننا نعرف أن الفرق في المنحدرات مهم من فترة التفاعل أعلاه. في الواقع، إذا كنت تأخذ من القيمة ض للتفاعل (3.57) وميدان ذلك (12.7449)، يمكنك الحصول على تشي مربع هو مبين أدناه في حدود خطأ التقريب. الرسوم البيانية التفاعل يمكننا تصور المنحدرات بسيطة من خلال الرسوم البيانية التفاعل باستخدام الاختلاف من هوامش مع خيار في () جنبا إلى جنب مع الأمر marginsplot. نموذج النمو الدرجة الثانية ونحن لم يكن لديك لتقييد أنفسنا إلى وجود علاقة خطية مع مرور الوقت. نحن يمكن أن تشمل بسهولة تأثير الدرجة الثانية بتكرار المدى c. ctime في نموذجنا. الرسوم البيانية نموذج الدرجة الثانية يمكننا رسم بياني لنموذج من الدرجة الثانية باستخدام نفس الهوامش وmarginsplot الأوامر التي استخدمناها للنموذج نموذج النمو مكعب الخطي وإذا أضفنا إلى ctime إضافي لنموذج النمو الدرجة الثانية لدينا، وحصلنا على نموذج النمو مكعب. الرسوم البيانية والمنحدرات نموذج مكعب لكل معاملة ونقطة زمنية مع اختلاف طفيف في الأمر الهوامش، يمكننا الحصول على المنحدرات لكل مجموعة العلاج في كل نقطة زمنية. وسوف نلاحظ أن للعلاج 2 المنحدرات تبقي فقط الحصول على أكثر حدة وأكثر حدة، في حين لتلقي العلاج 1، والمنحدرات ترتفع ثم تتراجع. مزايا وعيوب نماذج مختلطة هناك مزايا وعيوب لاستخدام نماذج مختلطة ولكن على نماذج مختلطة كلها أكثر مرونة والحصول على مزيد من المزايا من العيوب. مزايا تلقائيا يحسب الأخطاء المعيارية الصحيحة لكل أثر يسمح عدم الاتزان أو الملاحظات المفقودة داخل موضوع يسمح فترات زمنية متفاوتة يسمح مختلف الهياكل التغاير داخل موضوع يسمح الوقت لأن تعامل على أنها عيوب الفئوية أو مستمرة xtmixed تقارير نتائج خي مربع والقيم ص هي مناسبة لعينات كبيرة ومنحازة إلى أسفل في عينات صغيرة يجب ألا يفسر محتوى هذا الموقع بأنه تأييد للأي موقع معين على شبكة الإنترنت، كتاب، أو منتج البرنامج من قبل جامعة كاليفورنيا. تنظيف البيانات في البيانات الحسابية التنظيف هو مصطلح واسع بدلا من أن ينطبق على التلاعب الأولية على مجموعة البيانات قبل التحليل. وسيكون في كثير من الأحيان تكون المهمة الأولى لمساعد باحث وهو الجزء مملة من أي مشروع بحثي الذي يجعلنا نتمنى قام مساعد والبحوث. الحسابية هي أداة جيدة لتنظيف ومعالجة البيانات، بغض النظر عن البرنامج الذي تنوي استخدام لتحليلها. الأول تمرير الخاص بك في مجموعة بيانات قد ينطوي على أي من أو كل ما يلي: إنشاء عدد من مجموعات فرعية أصغر استنادا إلى معايير البحث إسقاط الملاحظات اسقاط المتغيرات تحويل المتغيرات التعامل مع القيم المتطرفة إنشاء المتغيرات الجديدة نقل المتغيرات المتغيرات وصفها إعادة تسمية المتغيرات سواء كان هذا هو أول التنظيف وقتك البيانات أو أنت قرد البيانات محنك، قد تجد بعض النصائح المفيدة من خلال قراءة المزيد. استخدام ملف التعليمات الحسابية. وقد الحسابية المدمج في ميزة تسمح لك للوصول إلى دليل المستخدم وكذلك ملفات مساعدة على أي أمر معين. ببساطة اكتب المساعدة في إطار الأوامر، متبوعا باسم الأمر كنت بحاجة إلى مساعدة مع واضغط على مفتاح Enter: كتابة القيام الملف. أبدا تنظيف مجموعة بيانات عن طريق إدخال عمياء الأوامر (أو ما هو أسوأ، وأزرار النقر). كنت تريد أن تكتب الأوامر في ملف تأليف، ومن ثم تشغيله. بهذه الطريقة، إذا قمت بخطأ ما، سوف لا يكون خربت مجموعة البيانات الخاصة بك كامل، وأنك لن تحتاج إلى البدء من جديد من نقطة الصفر. هذا هو النصيحة العامة التي تنطبق على أي عمل تقوم به على الحسابية. العمل من تأليف ملفات تتيح للآخرين مشاهدة ما فعلت إذا كنت من أي وقت مضى بحاجة إلى نصيحة، فإنه يجعل عملك استنساخه ويسمح لك لتصحيح الأخطاء الصغيرة بشكل غير مؤلم إلى حد ما. لبدء ملف المهام، انقر على أيقونة يشبه المفكرة في الزاوية العلوية اليسرى من الخاص الحسابية المشاهد 2. في المراحل الأولية من العمل الخاص بك، فإنك قد تشعر أن ملف تأليف أكثر عائق مما هو عليه فائدة. على سبيل المثال، إذا كنت لم تكن مألوفة جدا مع أمر، قد كنت تفضل محاولة لأول مرة. واحد طريقة بسيطة للقيام بذلك والتي لا تزال الانضباط عن الكتابة تفعل الملفات هي إلى حسابك على إكبس ملف افعل في مراحل، والكتابة فقط عدد قليل من الأوامر قبل تنفيذها، وتصحيح الأخطاء كما تذهب. من أجل تنفيذ عدد من الأوامر بدلا من كامل افعل الملف، ببساطة تسليط الضوء على تلك التي تريد تنفيذ، وانقر على أيقونة تنفيذ اختيار (لا) على رأس محرر افعل الملف الخاص بك، في أقصى اليمين. كما يمكنك أن تصبح أكثر كفاءة مع البرمجة في الحسابية، أنت ربحت ر الحاجة لمحاولة الخروج الأوامر بعد الآن، وعليك اكتشاف متعة من كتابة ملف تأليف وبعد ذلك يعمل دون خلل. لتشغيل كامل افعل ملف، لا تسليط الضوء على أي جزء منها وانقر على أيقونة تنفيذ اختيار (لا). قد تتساءل حول الأوامر واضحة، تعيين أكثر من وتعيين ذاكرة 15000 في المثال قطة. هذه الأوامر الثلاثة هي الأوامر الإدارية التي هي مفيدة جدا أن يكون في بداية من ملف تأليف. أول، واضحة، ويستخدم لمسح أي بيانات السابق قد تم العمل على. الأمر وضع أكثر من يروي الحسابية ليس إلى وقفة أو عرض رسالة --more--. وأخيرا، وضع الأمر ذاكرة 15000 يزيد من الذاكرة المتاحة لالحسابية من جهاز الكمبيوتر الخاص بك ونحن هنا سوف تحتاج إليها ويبلغ حجم مجموعة البيانات التي تم تحميلها من 3 أكبر من 10MB المخصصة للبيانات بشكل افتراضي. تعليق واحد الماضي عن قيام الملفات: إذا قمت بالنقر المزدوج فوق الملف المحفوظ به، فإنه لن فتح للتحرير، وإنما الحسابية سيستمر أن تفعل ملف، والتي يمكن أن تكون مزعجة قليلا لإعادة فتح ملف تأليف من مجلد دون تنفيذ الأوامر في ذلك، انقر بزر الماوس الأيمن عليه ثم اختر تحرير بدلا من فتح. احتفظ السجل. مرة أخرى، وهذا هو كقاعدة عامة من الإبهام على الحسابية. الاحتفاظ بسجل يعني أنك يمكن أن نعود وننظر في ما فعلت دون الحاجة إلى القيام بذلك مرة أخرى. بدء السجل هو مجرد مسألة إضافة أمر في الجزء العلوي من ملف هل لديك أن يقول الحسابية للتسجيل، وكذلك المكان الذي تريد سجل ليتم حفظها: تسجيل الدخول باستخدام whateverpathyouwant: pickanameforyourlog. smcl 4. استبدال 5 ملاحظة كيفية حفظ السجلات تحت تمديد smcl. لا تنسى أن تغلق السجل الخاص بك قبل البدء واحدة جديدة. الأمر الأخير على الخاص تفعل ملف 6 وعادة ما يتم تسجيل قريبة. حفظ كما تذهب. أجهزة الكمبيوتر تحطم، انقطع التيار الكهربائي، هذا الشيء يحدث. حفظ ملفات هل لديك كل بضع دقائق أثناء كتابتها. حفظ ملف تأليف يتم بنفس طريقة حفظ أية وثيقة محرر النص: إما النقر على رمز القرص المرن، أو اضغط على CTRL S: يجب أيضا حفظ بيانات الخاصة بك كما كنت تعديله، ولكن تأكد للحفاظ على نسخة واحدة من مجموعة البيانات الأصلية في حال كنت بحاجة للبدء من جديد. الأمر لحفظ بيانات عن أعداد الحسابية هو حفظ، متبوعا مسار حيث تريد مجموعة البيانات ليتم حفظها، والأمر اختياري محل. لاحظ كيف التمديد للبيانات الحسابية هو. dta، وأيضا نلاحظ كيف أن البيانات الجديدة له اسم مختلف عن الأصلي 7. تعرف على مجموعة البيانات الخاصة بك. مجموعات البيانات تأتي مع كتب الشفرات. يجب أن نعرف كل ما هو متغير، وكيف ق مشفرة، كيف يتم تحديد القيم المفقودة. ومن الممارسات الجيدة هو أن ننظر في الواقع في البيانات، حتى يتسنى لك فهم هيكل من المعلومات. للقيام بذلك، يمكنك النقر على البيانات في الزاوية العلوية اليسرى من المشاهد الخاصة بك وحدد محرر البيانات، ثم تحرير البيانات (الاستعراض). سيتم فتح نافذة جديدة ويمكنك ان ترى البيانات الخاصة بك. يمكنك أيضا استخدام استعراض الأوامر، إما عن طريق كتابتها مباشرة في إطار الأوامر أو من ملف تأليف: واحدة من السمات المميزة لهو أنه عندما قمت بتحميل مجموعة بيانات، لأنه يأتي مع العلامات. متغيرا علامات وصفا للمتغيرات، وتستخدم تسميات قيمة لوصف الطريقة يتم ترميز المتغيرات. في الأساس، والتسمية قيمة يجلس على أعلى من القانون، بحيث عندما تتصفح وأنت ترى ماذا يعني رمز بدلا من ما هو عليه. لجعل هذا أكثر وضوحا، دعونا ننظر في البيانات مع أي تسميات. انظر، على سبيل المثال، في متغير GEOPRV. إنشاء عدد من مجموعات فرعية أصغر بناء على معايير الأبحاث وهناك العديد من الأسباب التي قد ترغب مجموعة فرعية صغيرة من البيانات الخاصة بك ولكن الشيء الرئيسي هو أن أكبر مجموعة البيانات، كلما كان من الصعب هو الحسابية لإدارة، مما يبطئ النظام الخاص بك. هدفك هو جعل مجموعة البيانات الخاصة بك صغيرة قدر الإمكان، مع الحفاظ على جميع المعلومات ذات الصلة. يحدد جدول أعمال البحوث الخاصة بك ما سيتضمن مجموعة البيانات النهائي الخاص بك. دعونا نقول لكم لديها بيانات عن العادات الصحية من الكنديين الذين تتراوح أعمارهم بين 12 سنة فما فوق، ولكن سؤال البحث الخاص بك هو محدد للنساء في سن الإنجاب المعيشة في أونتاريو 8. كنت دون بوضوح ر بحاجة للحفاظ على الرجال في مجموعة البيانات الخاصة بك، وكنت فاز ر بحاجة للحفاظ على سكان المحافظات الأخرى من أونتاريو. وعلاوة على ذلك، وربما يمكنك إسقاط النساء تحت سن 15 وأكثر من 55 سنة. الآن، دعونا ننظر في كيف ستفعل ذلك. لإسقاط الملاحظات، تحتاج إلى الجمع بين واحد من اثنين من الأوامر الحسابية (الاحتفاظ أو انخفاض) مع إذا تصفيات. تأكد من أنك قد قمت بحفظ بيانات الأصلي قبل أن تبدأ. وينبغي أن تستخدم الأمر الاحتفاظ بها مع الحذر (أو تجنبها تماما) لأنه سينخفض ​​لكن كل ما عليك أن تبقي على وجه التحديد. هذا يمكن أن يكون مشكلة إذا لم تكن 100 معين من ما تريد الاحتفاظ بها. والأمر قطرة قطرة من مجموعة البيانات الخاصة بك ما كنت أسأل تحديدا الحسابية في الانخفاض. وإذا تصفيات يحد من نطاق الأمر على هذه الملاحظات والتي تبلغ قيمة تعبير صحيح. بناء الجملة من أجل استخدام هذه التصفيات هو بسيط جدا: أين القيادة في هذه الحالة سيكون، وانخفاض وعملي هو التعبير الذي يجب أن يكون صحيحا للأمر قطرة لتطبيق 9. باستخدام المثال من النساء في سن الإنجاب في أونتاريو، والخط الأول سلط الضوء يسقط الرجال، السطر الثاني يسقط أي ملاحظات لا في أونتاريو، في حين أن السطر الأخير قطرات الملاحظات في الفئات العمرية الأكبر أو الأصغر سنا مما لدينا فرعية من الفائدة. عليك أن تكون حذرا مع العوامل المنطقية إشعار بناء الجملة في السطر الثالث. وهناك خطأ شائع هو أن نسأل الحسابية لإسقاط إذا DHHGAGE 2. لا توجد الأفراد في مجموعة البيانات الذين تتجاوز أعمارهم 55 والذين تقل أعمارهم عن 15. ونحن نريد لإسقاط إذا مضى عليها أكثر من 55 أو أقل من 15. وفيما يلي قائمة المشغلين في التعبيرات. هل نستخدم في الغالب العوامل المنطقية والعلائقية بالتزامن مع الحالات التالية: الطريقة الأخرى التي قد تحتاج إلى جعل مجموعة البيانات الخاصة بك أصغر هو من خلال إسقاط المتغيرات التي ليست مفيدة لالبحوث الخاصة بك. ومن المحتمل أن يكون تم تكرار المعلومات الواردة في متغير معين (أي متغير آخر يقدم نفس المعلومات)، أو ربما جميع الملاحظات لمتغير مفقودة، أو متغير يحدث لمجرد أن يكون في مجموعة البيانات الخاصة بك ولكن لا يهم إلى البحوث الخاصة بك . إسقاط المتغيرات واضح وصريح جدا لمجرد استخدام الأمر الإفلات. وعند النظر إلى البيانات من CCHS، يتم ترميز المتغير SLP 01 (عدد الساعات التي يقضيها في النوم في الليلة الواحدة) كما اللا (لا تنطبق) لكل ملاحظة في مجموعة البيانات. ومن الواضح أننا لن تتعلم أي شيء من هذا المتغير، حتى نتمكن من إسقاطه. بناء الجملة من أجل إسقاط متغير بسيط: أين هو varlist قائمة المتغيرات التي ترغب في إسقاط. انه من السهل أن يسقط عدد من متغير في الوقت بهذه الطريقة. أنا هنا اسقاط كل المتغيرات التي كانت مشفرة كما لا ينطبق على أكثر من 95 من ملاحظات 10: في بعض الأحيان لا يتم ترميز المتغيرات بالطريقة التي تريد لها أن تكون. في هذا القسم سوف ننظر إلى تحولين قد تحتاج إلى القيام به على بعض المتغيرات قبل استخدامها: إعادة رمز وdestring. يتغير الأمر إعادة رمز قيم المتغيرات الرقمية وفقا لقواعد محددة. في ورقة العمل CCHS، العديد من المتغيرات والقيم المفقودة مشفرة كما. a أو. د. هذا أمر مريح لأنه لن يؤثر على العمليات الحسابية قد تفعل ذلك باستخدام البيانات (على سبيل المثال إذا كنت حساب متوسط). ومع ذلك، تستخدم العديد من قواعد البيانات 999 باعتبارها رمز المتغير في عداد المفقودين، والتي قد تكون مشكلة. ونحن قد ترغب في إعادة رمز هذه الحال. لكي لا يكون لهم أي تأثير الحسابات نخطط على القيام مع البيانات. بناء الجملة من أجل هذا الأمر هو: إعادة رمز varlist (القيمة القديمة (الصورة) قيمة جديدة) 11 لق إعادة رمز الارتفاع والمتغيرات مؤشر كتلة الجسم من البيانات CCHS، (من أجل التوضيح، لأنه حقا ليس من الضروري في هذه الحالة): الأمر destring يسمح لك لتحويل البيانات المحفوظة في تنسيق سلسلة (أي أبجدية) في شكل رقمي. لا يحتوي على بيانات CCHS أي متغير سلسلة. من أجل أن نرى ما يبدو متغير سلسلة مثل، يمكننا استخدام الأمر العكس، tostring، لإنشاء متغير سلسلة. ونحن ثم تحويل هذا المتغير إلى شكل رقمي. ويظهر متغير سلسلة باللون الأحمر في بيانات المحرر: على الرغم من أنها قد تبدو نفس القرض العقاري متغير 2، ستاتا لا تستطيع أن تفعل أي حسابات على متغير سلسلة (منذ شكله هو قول الحسابية أنه مصنوع من حروف أو رموز أخرى) . السماح ليالي destring ذلك: لاحظ استخدام خيارات توليد واستبدال. عندما أنشأنا متغير سلسلة وهمية، وكنا تولد لأننا أردنا متغير جديد منفصل. الآن، ونحن عندما destring، نحن استبدال متغير سلسلة من نظيره العددي. كيف اخترت القيام بذلك في مجموعة البيانات الخاصة بك يعتمد على كيف كنت تخطط لاستخدام المتغيرات. سوف لا يزال لديك أي استخدام للمتغير سلسلة إذا كان الأمر كذلك توليد واحدة جديدة عند destring. هل تريد فقط أن متغير لا يكون في شكل سلسلة ثم يحل محله مع واحدة جديدة. هنا، يمكننا أن نرى أن لدينا سلسلة متغير الآن متطابقة تماما لCIH متغير 2: (يمكننا إسقاط هذا المتغير الآن) ايسكنون تستحق قسم الخاصة بهم لأن هناك كثير من الأحيان الارتباك بشأن ما يشكل بالضبط عزلاء. عزلاء هو لا الملاحظة مع قيمة غير عادية ولكن المحتملة لمتغير 12 الأحداث النادرة قوعها. القيم المتطرفة يجب عليك أن تشعر بالقلق إزاء هي تلك التي تأتي من الترميز خطأ. كيف يمكنك معرفة ما هو الذي الحس السليم يقطع شوطا طويلا هنا. أولا، أن ننظر في البيانات الخاصة بك باستخدام محرر البيانات (الاستعراض). القيم المتطرفة تميل إلى القفز على لك. إذا كان لديك مجموعة بيانات صغير، يمكنك أيضا جدولة كل من المتغيرات الخاصة بك: سوف جدولة متغير أعطيك قائمة من كل القيم الممكنة التي تأخذ متغير في مجموعة البيانات. والقيم المتطرفة أن تكون القيم المتطرفة. نظرة على أمر من حجم. هل هذه القيم للتصديق إذا كانت بيانات كبيرة جدا، ومع ذلك، فإنه قد لا يكون عمليا إلى التحديق في كل القيم متغير يمكن أن تتخذ. في الواقع، سوف الحسابية لا جدولة إذا كان هناك الكثير من القيم المختلفة. يمكنك أن تبحث في البيانات الخاصة بك في مؤامرة مبعثر: في مجموعة البيانات CCHS، caseid هو معرف الفردي، في حين hwtghtm هو الطول بالمتر. الرسم البياني يخبرنا أنه لا توجد القيم المتطرفة في هذه البينات: وهناك طريقة أخرى للبحث عن القيم المتطرفة هي تلخيص الملاحظات لمتغير باستخدام الخيار مفصل: إن نافذة نتيجة تظهر النسب المئوية الرئيسية للتوزيع (بما في ذلك متوسط ​​50)، لحظات الأربعة الأولى، فضلا عن أكبر أربعة أصغر وأربع ملاحظات: من الواضح أن هناك أي القيم المتطرفة. دعونا نتخيل للحظة أن المئين 99 من التوزيع ارتفاع يتضمن الملاحظة مع 5.2M أدخلته أثناء الارتفاع. هل من المعقول أن هناك حقا امرأة 5.2M سجلت في هذه نظرة بيانات في الترتيب من حيث الحجم التي هذه الملاحظة سوف تختلف من ثاني أكبر. ق تقريبا 50 الانحرافات المعيارية أكبر. ماذا يجب ان تفعل مع هذه الملاحظة وهناك عدد من الحلول ولكن لا شيء على ما يرام: إسقاط ذلك من مجموعة البيانات الخاصة بك (إسقاط إذا hwtghtm 1،803) استخدم إذا تصفيات لاستبعادها عند إنشاء الإحصائيات التي تستخدم متغير الارتفاع (الأمر إذا hwtghtm 1،803 ) تجاهل أنه إذا كان المتغير الارتفاع ليست في الواقع أن المهم في البحث الخاص بك وبقية المتغيرات لهذه الملاحظات يتم ترميز على ما يرام هناك نوعان من الأوامر الرئيسية التي تحتاج إلى معرفته لتوليد المتغيرات الجديدة: الجنرال هو للأساسيات، في حين egen يتيح لك الحصول على يتوهم جدا. يمكنك الجمع بين هذه مع تصفيات كأن أو في وكذلك بادئة مثل قبل وbysort 14. على سبيل المثال، لنفرض أنك تريد إنشاء متغير تخبرك ما إذا كانت النساء في مجموعة البيانات لديها شريك يعيش في. في حين لا توجد وسيلة أكيدة للإقامة ذلك، فإننا سوف تقريب ذلك بافتراض أن النساء اللواتي أشارت حالتها الزوجية بأنها متزوجة أو القانون العام يعيش فعلا مع الزوج أو الشريك القانون العام: السطر الأول يخلق livein متغير و يسند القيمة 1 إذا كانت قيمة المتغير الحالة الاجتماعية (dhhgms) هي إما 1 (متزوج) أو 2 (القانون العام). السطر الثاني محل رمز قيمة المفقود من قبل 0، مما يجعل livein ثنائي متغير. والآن، دعونا نقول لكم أود أن إنشاء متغير نوعي تخبرك، حسب الفئة العمرية، إذا كانت المرأة تحت أو فوق المتوسط ​​من حيث مؤشر كتلة الجسم (BMI). السطر الأول من الأمر بإنشاء متغير (meanbmi) الذي يأخذ على قيمة فريدة لكل فئة عمرية، وبلغ متوسط ​​مؤشر كتلة الجسم لتلك الفئة العمرية. وbysort البادئة هو مزيج من قبل والنوع الذي يمكن كسرها مكافئ إلى أمرين: من DHHGAGE: egen meanbmi متوسط ​​(HWTGBMI) الجزء النوع من الأمر ينظم المراقبة وفقا لDHHGAGE متغير، من الأصغر إلى الأكبر، وهي خطوة المطلوب قبل القيام بأي إجراء من جانب متغير. ق عادة أسهل للاستخدام فقط bysort. خطوط الثانية والثالثة (بدءا جنرال) إنشاء متغير ثنائي الذي يساوي 0 إذا ملاحظة ديها أدنى مؤشر كتلة الجسم من المتوسط ​​للفئة العمرية لها، و1 إذا كان لها مؤشر كتلة الجسم هو فوق معدله الفئة العمرية. والآن بعد أن كنت قد أنشأت هذه المتغيرات الجديدة، سيكون من الجميل للتأكد من أن القواعد التي تم إنشاؤها لهم كانت صحيحة. من الناحية المثالية، تريد أن ننظر إلى livein (متغير جديد على أساس الحالة الاجتماعية) وdhhgms (متغير الحالة الاجتماعية). ومع ذلك، فإنه من الصعب المقارنة بين المتغيرات إلا إذا كانوا جنبا إلى جنب. يمكنك استخدام الأمر لنقل متغير (أي نقل عمود من مجموعة البيانات الخاصة بك). عندما تقوم بإنشاء متغير، افتراضيا يصبح العمود الأخير من مجموعة البيانات الخاصة بك. يمكنك تحريكه بجانب متغير آخر بدلا من ذلك: الآن إذا نظرنا إلى مجموعة البيانات لدينا، يمكننا أن نرى المقارنة بين المتغير الجديد إلى القديم والتأكد من أننا مشفرة بشكل صحيح: وبالمثل، لأن لدينا اثنين من المتغيرات الجديدة المتعلقة مؤشر كتلة الجسم هي الآن الأعمدة الأخيرة، دعونا ق نقل متغير مؤشر كتلة الجسم الأصلي إلى نهاية ورقة العمل: والآن من السهل إلقاء نظرة على المتغيرات الجديدة لدينا: هل لاحظت هذه المشكلة على خط 8 bmicat متغير لا ينبغي أن تكون مشفرة 1 إذا تم ترميز متغير مؤشر كتلة الجسم الأصلي كما قيمة مفقودة. يمكننا تحديد هذا مع سريعة ليحل محل: استبدال bmicat. إذا hwtgbmi. D كلما قمت بإنشاء متغير جديد، انها فكرة جيدة لتسميته. لماذا وجود المتغيرات الخاصة بك وصفت يجعل من السهل بالنسبة لك أو أي شخص آخر باستخدام بيانات لمعرفة بسرعة ما يمثل كل متغير. يجب أن نفكر في عملك كشيء أن الناس يجب أن تكون قادرة على التكاثر.

No comments:

Post a Comment