دمج - ملاحظات - في - الحسابية الفوركس


إشعار: ستقوم مجموعة الاستشارات الإحصائية إدر بترحيل الموقع إلى نظام إدارة المحتوى في وردبريس في فبراير لتسهيل الصيانة وإنشاء محتوى جديد. ستتم إزالة بعض صفحاتنا القديمة أو وضعها في الأرشيف بحيث لا يتم الاحتفاظ بها بعد الآن. سنحاول الحفاظ على عمليات إعادة التوجيه بحيث تستمر عناوين ورل القديمة في العمل بأفضل ما في وسعنا. مرحبا بكم في معهد للبحوث الرقمية والتعليم مساعدة مجموعة استشارات الدولة من خلال إعطاء هدية ستاتا وحدة التعلم الجمع بين البيانات هذه الوحدة سوف توضح كيف يمكنك الجمع بين الملفات في ستاتا. وستتضمن الأمثلة ملفات إلحاق، ومطابقة واحدة إلى مطابقة واحدة، وتطابق عملية دمج من واحد إلى أكثر. إلحاق ملفات البيانات عندما يكون لديك ملفان بيانات، قد ترغب في الجمع بينهما عن طريق تكديسهما على أحدهما الآخر. على سبيل المثال، لدينا ملف يحتوي على آباء وملف يحتوي على أمهات كما هو موضح أدناه. إذا أردنا الجمع بين هذه الملفات عن طريق التراص لهم واحد على الجانب الآخر، يمكننا استخدام الأمر إلحاق كما هو مبين أدناه. يمكننا استخدام الأمر قائمة لمعرفة ما إذا كان هذا يعمل بشكل صحيح. عملت إلحاق بشكل صحيح. يتم تكديس الآباء والأمهات معا في ملف واحد. ولكن، هناك مشكلة صغيرة. نحن غير قادر على معرفة الآباء من الامهات. دعونا نحاول القيام بذلك مرة أخرى، ولكن أولا سوف نقوم بإنشاء متغير يسمى مومداد في الآباء والأمهات ملف البيانات التي سوف تحتوي على أبي لملف بيانات الآباء وأمي لملف بيانات الامهات. عندما نجمع بين الملفين معا، فإن متغير مومداد سيخبرنا من هم الأمهات والآباء. نحن هنا جعل مومداد متغير لملف البيانات الآباء. نحن حفظ الملف يدعو ذلك dads1. نحن هنا جعل مومداد متغير لملف بيانات الامهات. نحن حفظ الملف يدعو ذلك moms1. الآن، يتيح إلحاق dads1 و moms1 معا. الآن، عندما نقوم بإدراج البيانات المتغير مومداد يظهر من الأمهات والآباء. دمج المطابقات طريقة أخرى لدمج ملفات البيانات هي دمج التطابق. قل أننا أردنا الجمع بين الآباء مع ملف البيانات فامينك، وجود معلومات الآباء والجانب المعلومات الأسرة إلى جنب. يمكننا القيام بذلك مع دمج المباراة. دعونا نلقي نظرة على الآباء وملف فامينك. نريد الجمع بين ملفات البيانات بحيث تبدو مثل هذا. لاحظ أن المتغير فاميد يستخدم لربط الملاحظة من ملف الآباء مع الملاحظة المناسبة من ملف فامينك. استراتيجية لدمج الملفات يذهب مثل هذا. 1. فرز الآباء على المجاعة وحفظ هذا الملف (يطلق عليه dads2). 2. نوع فامينك على المجاعة وحفظ هذا الملف (يطلق عليه faminc2). 3. استخدام ملف dads2. 4. دمج ملف dads2 مع ملف faminc2 باستخدام فاميد لمطابقتها. وهنا تلك الخطوات الأربع. 1. فرز ملف الآباء عن طريق فامد وحفظه كما dads2 2. فرز ملف فامينك بواسطة فامد وحفظه كما faminc2. 3. استخدام ملف dads2 4. دمج مع ملف faminc2 باستخدام فاميد كمتغير رئيسي. يبدو أن هذا يعمل على ما يرام، ولكن ما هو هذا المتغير دمج يشير متغير دمج، لكل ملاحظة، كيف ذهب الدمج. وهذا مفيد لتحديد السجلات غير متطابقة. دمج يمكن أن يكون واحدا من ثلاث قيم 1 - السجل يحتوي على معلومات من file1 فقط (على سبيل المثال سجل dad2 مع عدم وجود سجل Faminc2 المقابلة 2 - السجل يحتوي على معلومات من file2 فقط (على سبيل المثال سجل Faminc2 مع أي سجل dad2 المقابلة 3. - يحتوي السجل على معلومات من كلا الملفين (على سبيل المثال، سجلات داد 2 و Faminc2 مطابقة)، وعندما يكون لديك العديد من السجلات، فإن جدولة الدمج مفيدة جدا لتلخيص عدد عدم التطابق لديك، وفي حالتنا، تتطابق جميع السجلات بحيث تكون قيمة الدمج كان دائما 3. واحد إلى العديد من دمج المباراة نوع آخر من الدمج يسمى واحد إلى العديد من الدمج. لدينا دمج واحد إلى واحد المتطابقة ما يصل الآباء و فامينك وكان هناك واحد إلى واحد مطابقة الملفات. إذا كنا دمج الآباء مع يمكن أن يكون هناك العديد من الأطفال لكل أبي، وبالتالي هذا هو واحد إلى العديد من الدمج كما ترون أدناه، استراتيجية واحد لدمج العديد هو حقا نفس دمج واحد إلى واحد 1. فرز الآباء على المجاعة و حفظ هذا الملف كما dads3 2. فرز الاطفال على المجاعة وحفظ ذلك ملف ك kids3 3. استخدام ملف dads3 4. دمج ملف dads3 مع ملف kids3 باستخدام فاميد لمطابقتها. وترد أدناه الخطوات 4. 1. فرز ملف البيانات الآباء على فاميد وحفظ هذا الملف كما dads3. 2. فرز ملف بيانات الأطفال على فاميد وحفظ هذا الملف ك kids3. 3. استخدم الملف dads3. 4. دمج ملف dads3 مع ملف kids3 باستخدام فاميد لمطابقتها. يتيح قائمة النتائج. النتائج أسهل قليلا لقراءة إذا كنا فرز البيانات على المجاعة والولادة. كما ترى، هذا هو في الأساس نفس دمج واحد إلى واحد. قد تتساءل عما إذا كان ترتيب الملفات في بيان الدمج ذو صلة. هنا، نحن تبديل ترتيب الملفات والنتائج هي نفسها. والفرق الوحيد هو ترتيب السجلات بعد الدمج. إلحاق مثال البيانات مثال دمج الخطوات مثال (واحد إلى واحد وشخص إلى آخر) برنامج دمج الدمج المتطابق يجب ألا يفسر محتوى هذا الموقع على أنه تأييد لأي موقع ويب أو كتاب أو منتج برنامج معين من قبل جامعة كاليفورنيا. ملاحظة: سوف إدر المجموعة الاستشارية الإحصائية ترحيل الموقع إلى وردبريس كمس في فبراير لتسهيل الصيانة وإنشاء محتوى جديد. ستتم إزالة بعض صفحاتنا القديمة أو وضعها في الأرشيف بحيث لا يتم الاحتفاظ بها بعد الآن. سنحاول الحفاظ على عمليات إعادة التوجيه بحيث تستمر عناوين ورل القديمة في العمل بأفضل ما في وسعنا. مرحبا بكم في معهد للبحوث الرقمية والتعليم مساعدة المجموعة الاستشارية مجموعة من خلال إعطاء هدية ستاتا أسئلة وأجوبة: كيف يمكنني دمج ملفات متعددة في ستاتا ويستند هذا السؤال الشائع على الصفحة التي وضعتها برنامج مساعد الإحصاء الدراسات العليا في كلية بوسطن. نحن ممتنون لإذنهم لإعادة إنتاج هذه الأسئلة الشائعة هنا. ليس من غير المألوف بالنسبة للبيانات، وخاصة بيانات المسح، أن تأتي في مجموعات بيانات متعددة (هناك أسباب عملية لتوزيع مجموعات البيانات بهذه الطريقة). عندما يتم توزيع البيانات في ملفات متعددة، والمتغيرات التي تريد استخدامها غالبا ما تكون متناثرة عبر عدة مجموعات البيانات. من أجل العمل مع المعلومات الواردة في اثنين أو أكثر من ملفات البيانات من الضروري دمج الشرائح في ملف جديد يحتوي على كافة المتغيرات التي تنوي العمل معها. أولا، سوف تحتاج إلى معرفة المتغيرات التي تحتاج إليها، ومجموعات البيانات التي تحتوي عليها، يمكنك القيام بذلك عن طريق استشارة دفتر الشيفات. بالإضافة إلى إيجاد المتغيرات التي تريدها لتحليلك، تحتاج إلى معرفة اسم متغير المعرف. متغير معرف هو متغير فريد لحالة (الملاحظة) في مجموعة البيانات. بالنسبة إلى فرد معين، يجب أن يكون المعرف هو نفسه في جميع مجموعات البيانات. سيتيح لك ذلك مطابقة البيانات من مجموعات بيانات مختلفة إلى الشخص المناسب. أما بالنسبة للبيانات المقطعية، فسيكون هذا عادة متغيرا واحدا، وفي حالات أخرى، هناك حاجة إلى متغيرين أو أكثر، وينظر إلى ذلك عادة في بيانات اللوحة حيث غالبا ما تكون هناك حاجة إلى معرف الموضوع والتاريخ أو الموجة لتحديد الملاحظة بشكل فريد. لكي يقوم ستاتا بدمج مجموعات البيانات، يجب أن يكون للمتغير إد أو المتغيرات نفس الاسم عبر جميع الملفات. بالإضافة إلى ذلك، إذا كان المتغير عبارة عن سلسلة في مجموعة بيانات واحدة، يجب أن يكون أيضا سلسلة في جميع مجموعات البيانات الأخرى، وينطبق الشيء نفسه على المتغيرات الرقمية (نوع التخزين المحدد ليس مهما، طالما أنها رقمية). وبمجرد تحديد جميع المتغيرات التي تحتاج إليها، ومعرفة ما المتغير (إد) المتغير، يمكنك البدء في دمج مجموعات البيانات. مثال بسيط الخطوة الأولى الجيدة هي وصف بياناتنا. يمكننا أن نفعل ذلك دون فتح ملف فعلا (وهذا يمكن أن يكون مفيد إذا كانت الملفات كبيرة جدا)، كل ما علينا القيام به هو فتح ستاتا وإصدار الأمر. يعطي الأمر وصف لنا الكثير من المعلومات المفيدة، لأغراضنا أهم الأشياء التي تظهر هو أن معرف المتغير هو رقمي، وأن البيانات هي غير مصنف (يجب أن يتم فرز البيانات حسب المتغير معرف أو المتغيرات من أجل الدمج ). ونلاحظ أيضا أن المتغيرات التي نريدها من مجموعة البيانات هذه هي في الواقع في مجموعة البيانات. نحن نريد أن نفعل ذلك لجميع ثلاث مجموعات من البيانات، ولكن لتوفير مساحة جيدة فقط إظهار الإخراج لأحد مجموعات البيانات. لنفترض أن مجموعات البيانات كلها غير مشتتة وأن متغير المعرف له نفس الاسم (المعرف) في مجموعات البيانات الثلاث. منذ فرز البيانات أرينت فرز، ونحن سوف تحتاج إلى فتح كل مجموعة البيانات، وفرزها، ثم قم بحفظ مجموعة البيانات التي تم فرزها. على الرغم من أننا يمكن استخدام البيانات من موقع بسهولة داخل ستاتا، ونحن لا يمكن حفظه هناك. لذلك لاحظ أن جميع الأوامر استخدام سحب مجموعات البيانات من موقعنا على الانترنت، ولكن حفظها إلى الدليل د: البيانات على الكمبيوتر المستخدمين. تفتح الصيغة أدناه كل مجموعة بيانات، وتصنفها بحسب المعرف، ثم تحفظها في موقع جديد باسم جديد. إذا كانت مجموعة البيانات موجودة بالفعل على جهاز الكمبيوتر الخاص بنا، يمكننا حفظها في نفس الموقع، وربما حتى تحت نفس الاسم (استبدال مجموعة البيانات القديمة)، وهذا هو اختيار المستخدمين. بعد ذلك، نقوم فعلا بدمج مجموعات البيانات. يدمج الأمر دمج الملاحظات المقابلة من مجموعة البيانات الموجودة حاليا في الذاكرة (تسمى مجموعة البيانات الرئيسية) مع تلك من مجموعة بيانات ستاتا شكل مختلفة (تسمى مجموعة البيانات باستخدام) في ملاحظات واحدة. على افتراض أن لدينا data3 مفتوحة من تشغيل بناء الجملة أعلاه، التي ستكون لدينا مجموعة البيانات الرئيسية. السطر الأول من بناء الجملة أدناه يدمج البيانات. مباشرة بعد الأمر دمج هو اسم المتغير (أو المتغيرات) التي تخدم متغيرات معرف، في هذه الحالة إد. التالي هو الحجة باستخدام هذا يخبر ستاتا أننا تم القيام سرد المتغيرات معرف، وأن ما يلي هي مجموعة البيانات (ق) ليتم دمجها. يتم سرد الأسماء، مع مسافات فقط (لا الفاصلة، الخ) بينهما. (ملاحظة، إذا كانت أسماء أو مسارات مجموعات البيانات تتضمن مسافات، فتأكد من إرفاقها بعلامات اقتباس، أي.) السطر التالي من بناء الجملة يحفظ مجموعة البيانات الجديدة المدمجة. لاحظ أن دمج لا ينتج الإخراج. الآن يمكننا أن نلقي نظرة على لدينا مجموعة البيانات المدمجة حديثا. في الناتج أعلاه نرى عدد الحالات (200)، وهو الصحيح. هذا مهم لأن المشاكل مع عملية الدمج غالبا ما تؤدي إلى عدد قليل جدا، أو في كثير من الأحيان أكثر من اللازم، الحالات في مجموعة البيانات المدمجة. ونرى أيضا قائمة للمتغيرات، والتي تشمل جميع المتغيرات التي نريدها. تحتوي مجموعة البيانات المدمجة على ثلاثة متغيرات إضافية. يتم دمج هذه المتغيرات الجديدة. merge1 و merge2. سوف دمج الأوامر دائما توليد متغير إضافي واحد على الأقل اسمه دمج. عندما يتم تحديد ملفات متعددة في استخدام. فإن الأمر سوف ينتج متغيرات دمج إضافية، واحدة لكل من مجموعات البيانات في قائمة استخدام (في حالتنا merge1 و merge2). هذه المتغيرات تخبرنا حيث جاءت كل ملاحظة في مجموعة البيانات من، وهذا مفيد كما تحقق أن دمج البيانات الخاصة بك بشكل صحيح. في بعض الأحيان لن تكون هناك ملاحظة في مجموعة بيانات معينة، وهذا لا يعني بالضرورة أن شيئا ما حدث خطأ في عملية الدمج، ولكن هذا هو مكان آخر حيث يمكن للمرء في كثير من الأحيان الحصول على أدلة حول ما قد يكون خطأ في عملية الدمج. لأنه في هذا المثال كل من مجموعات البيانات تشمل جميع الحالات، ولأن الدمج ذهب كما ينبغي، متغيرات دمج مثيرة للاهتمام مثيرة جدا للاهتمام. وسوف نناقش هذه المتغيرات بمزيد من التفصيل أدناه، عندما نتعامل مع مجموعات البيانات حيث لا توجد جميع الحالات في جميع مجموعات البيانات. إسقاط المتغيرات غير المرغوب فيها ليس من غير المألوف أن نجد أن مجموعة بيانات كبيرة تحتوي على العديد من المتغيرات التي لن تستخدم في التحليل الخاص بك. يمكنك فقط ترك تلك المتغيرات في مجموعات البيانات الخاصة بك عند دمجها معا، ومع ذلك، هناك عدة أسباب قد لا تريد القيام بذلك. أولا، هناك حد لعدد المتغيرات ستاتا يمكن التعامل معها. في ستاتا الصغيرة الحد هو 99، في ستاتيك الحد هو 2،047 وفي ستاتاس و ستاتامب الحد هو 32،767. قد تظهر هذه الحدود عالية، ولكن إذا قمت بدمج مجموعات بيانات متعددة، كل منها يحتوي على عدد كبير من المتغيرات، قد تتجاوز الحد الخاص بنوع ستاتا. السبب الثاني الذي قد لا تريد ترك المتغيرات غير الضرورية في مجموعة البيانات الخاصة بك هو أن كل متغير في الذاكرة يستخدم موارد النظام إضافية. وهناك عدد قليل من المتغيرات الإضافية لن يضر أي شيء، ولكن إذا كان لديك عدد كبير من المتغيرات غير المرغوب فيها، قد يكون إضاعة موارد النظام. نعرض أدناه عدة طرق للقضاء على المتغيرات الإضافية. أحد الخيارات هو أنه عند فتح مجموعات البيانات لفرزها، يمكنك أيضا القضاء على المتغيرات التي لا تخطط لاستخدامها. اعتمادا على ما إذا كان من الأسهل أن قائمة المتغيرات التي تريد أن تخطط لاستخدامها في التحليل الخاص بك، أو لسرد تلك المتغيرات التي لا تحتاج إليها، يمكنك استخدام أوامر الاحتفاظ أو إسقاط. هناك خيار واحد إضافي على الأقل، يمكنك فتح مجموعات البيانات وضع فقط تلك المتغيرات التي تحتاج إليها في الذاكرة. إذا كان لدي مجموعة بيانات تحتوي على عدد من المتغيرات، ولكن المتغيرات الوحيدة التي أحتاج إليها من هو معرف وقراءة. يمكنني إضافة أسماء متغيرة إلى الأمر استخدامي كما هو موضح في السطر الأول من بناء الجملة أدناه. هذا مفيد بشكل خاص مع الملفات الكبيرة جدا التي تتطلب الكثير من الذاكرة لفتح. بمجرد فتح المجموعة الفرعية المطلوبة من المتغيرات، كل ما عليك القيام به هو حفظ مجموعة فرعية من البيانات تحت اسم جديد. في المثال أعلاه، يحتوي dataset2 المتغيرات التالية: إد، قراءة، كتابة، الرياضيات، العلوم، و سوست. افترض أن التحليل الخاص بي يتطلب فقط المتغيرات القراءة والكتابة. فإن المتغيرات الوحيدة من داتاسيت 2 التي تحتاج إليها هي تلك المتغيرتان ومعرف المتغير لدمج البيانات مع مجموعة بيانات أخرى. وفيما يلي أمثلة على نفس النوع من إعداد البيانات المذكورة أعلاه، وذلك باستخدام كل من التقنيات الموصوفة. وهذه التقنيات مكافئة، لأنها تنتج نفس النتيجة النهائية. كفاءة كل تقنية تختلف تبعا للحالة. استخدام الاحتفاظ لتحديد المتغيرات: استخدام إسقاط لإزالة المتغيرات غير المرغوب فيها: فتح مجموعة فرعية من البيانات: متغيرات الدمج متغير دمج (ق) التي تم إنشاؤها بواسطة أمر دمج من السهل أن تفوت، ولكنها مهمة جدا. وكما ذكرنا أعلاه، فإنهم يخبروننا أي مجموعة بيانات (مجموعات) كل حالة. هذا مهم لأن الكثير من القيم التي تأتي من مجموعة بيانات واحدة فقط قد توحي بوجود مشكلة في عملية الدمج. ومع ذلك، فإنه ليس من غير المألوف لبعض الحالات أن تكون في مجموعة بيانات واحدة، ولكن ليست أخرى. في بيانات لوحة هذا يمكن أن يحدث عندما لم يشارك المجيب معين في جميع موجات الدراسة. ويمكن أن يحدث أيضا لعدد من الأسباب الأخرى. على سبيل المثال، قد تظهر المستجيبة في المجموعة الفرعية من البيانات بالمعلومات الديموغرافية، ولكنها غائبة تماما عن المجموعة الفرعية من البيانات التي تحتوي على معلومات عن الأطفال المستجيبات من الأطفال، لأنها لا تملك أطفالا. ولأن الحالات غير الموجودة في جميع مجموعات البيانات ليست بالضرورة مشكلة، لكي تكون المعلومات في متغيرات الدمج مفيدة، عليك أن تعرف ما يمكن توقعه إذا تم دمج مجموعات البيانات بشكل صحيح. في المثال أعلاه، حيث ظهرت نفس 200 حالة في ثلاث مجموعات بيانات كنت أتوقع أن نرى 200 حالة، وكلها جاءت من ثلاث مجموعات من البيانات. إذا كان هناك بعض الحالات المفقودة من بعض مجموعات البيانات، ثم أتوقع أن نرى عدد معين من الحالات التي لم تأتي من جميع مجموعات البيانات، ولكن ما زلت بحاجة للتأكد من أن هناك الكثير من الخلافات التي تأتي من بعض فقط من قواعد البيانات. وجود عدد كبير جدا، أو كل الحالات في مجموعة البيانات المدمجة الخاصة بك يأتي من واحد، أو فقط عدد قليل من مجموعات البيانات التي تم دمجها هي علامة على أن متغير المعرف لا يتطابق بشكل صحيح عبر مجموعات البيانات. هذا أمر شائع بشكل خاص عندما يكون متغير المعرف هو سلسلة. أدناه ندرس مجموعة البيانات بعد الدمج لمعرفة ما إذا كان كل ذهب كما هو متوقع. يظهر الإخراج أدناه الملف يصف ل داتاسيت data1m. dta، إذا نظرنا إلى عدد الملاحظات (أوبس) نرى أن مجموعة البيانات تحتوي على 197 حالة فقط، ولكننا نعرف أن الدراسة شملت 200 حالة، لذلك نحن نعرف أن هناك هي ثلاث حالات مفقودة تماما من data1m. هذه معلومات مهمة إذا أردنا تفسير متغيرات الدمج بشكل صحيح في وقت لاحق. وأخيرا نقوم بفرز البيانات وحفظها تحت اسم جديد. لتوفير مساحة ونحن لن تظهر الإخراج لمجموعتي البيانات الأخرى (الرمز لا يظهر أدناه في حال كنت ترغب في تشغيله). نفترض أنه عندما نقوم بتشغيل وصف على data2m و data3m نكتشف أنها أيضا حالات مفقودة. تحتوي بيانات البيانات 2m على 196 ملاحظة، و dataset3m تحتوي على 197. ومن المحتمل أن بعض هذه الحالات مفقودة من جميع مجموعات البيانات الثلاث (أي تراكب الملاحظات المفقودة عبر مجموعات البيانات)، ولكن من الممكن أيضا أن تحدث جميع المشاهدات ال 200 في واحد على الأقل من قواعد البيانات. وسوف نكتشف بمجرد دمج البيانات. بعد أن نقوم بفحص وترتيب مجموعات البيانات يمكننا دمجها. بناء الجملة أدناه هذا، لاحظ أن الأمر هو نفسه كما في المثال الأول. بشكل افتراضي، ستاتا تسمح الحالات القادمة من أي من مجموعات البيانات الثلاث. هناك خيارات من شأنها أن تسمح لك بالتحكم في مجموعات البيانات التي تأتي من الحالات، يمكنك معرفة عن طريق كتابة مساعدة دمج (بدون علامات الاقتباس) في ستاتا. كما كان من قبل، أنشأ الأمر دمج ثلاثة متغيرات جديدة دمج. merge1. ودمج 2. وتوفر عملية الدمج المتغير معلومات عن الحالات الموجودة في مجموعة البيانات الرئيسية، وهي تأخذ إحدى القيم الثلاث التالية: الملاحظة موجودة فقط في مجموعة البيانات الرئيسية

Comments

Popular posts from this blog

Megacoin - usd - الرسم البياني لل الفوركس

Ig - أسواق سان جرمان - mt4 - الفوركس

Indikator - tbst - الفوركس