كيفية تنظيف بيانات الأسعار لBacktesting تنظيف البيانات لbacktesting ليس من السهل ولكن من الضروري جدا الحصول على نتائج ذات معنى. انشقاقات سعر سوء تعديل يمكن أن تحرف بيانات الأسعار وتضليل backtester غافلين في التفكير انهم جدت الكأس المقدسة عند مجرد يحدث الاستراتيجية للقبض على الجانب الجيد من فجوة سيئة. هيريس الخطوات لحجب البيانات القذرة وتنتج مجموعة بيانات نظيفة: 1. اختيار لا يقل عن 3 الباعة بيانات المرشح. 2. تنسيق البيانات للمقارنة. 3. كتابة برنامج للقيام المقارنة الذكية وتشغيله على مجموعات البيانات 3 مرشح. 4. تحليل سوء يقارن لمعرفة أي مجموعة في الخطأ. إذا 2 من 3 مجموعات تتفق، افترض ثت القيمة الصحيحة والنموذجية خاطئ. 5. إرسال ردود الفعل للبائعين البيانات حتى يتمكنوا من إصلاح الأخطاء. 6. حدد مجموعة من بيانات الأسعار التاريخية لاستخدامه في backtesting وقفل عليه لمنع التغييرات خلال backtesting. 7. تغذية بيانات الأسعار ذهبية لمحرك backtesting. أخذت هذه العملية لي عدة أسابيع من العمل ولكن كان يستحق ذلك للحصول على نتائج دقيقة. ثيريس جدوى من الذهاب الى العمل من backtesting إذا كانت البيانات الأساسية مليء الأخطاء. قراءة في لمزيد من التفاصيل إذا كنت تسير على محاولة هذا بنفسك أو إذا كنت ترغب فقط لمعرفة ما تذهب الاستعدادات في backtesting خطيرة. عند التداول مباشرة وتبحث شخصيا في الرسوم البيانية، من السهل بما فيه الكفاية لاكتشاف البيانات القذرة. فجوات واسعة على مخطط السعر وفتت الانظار ويمكنك التحقق من الأخبار على الرسم البياني مؤخرا. ومن الواضح أن بعض الثغرات السعر حقيقية ولكن قليلة هي الأخطاء عادة ما يكون الانقسام أو أرباح خاص لم تعدل بشكل صحيح. يمكن للإنسان في حالة تأهب والمريض فرز أنه من أصل كل حالة على حدة. مع backtesting محوسب تغطي أكثر من عقد من الزمن، البيانات القذرة هو أكثر انتشارا بكثير، من الصعب اكتشافها، وأصعب لإصلاح. الخطوة 1: اختيار الموردين بيانات المرشح. البيانات التي تأتي مع محركات backtesting هو الخيار الأول الطبيعي ونعم لا بد من تنظيفها! لدي الوصول إلى TradeStation وردين Telechart (ويعرف أيضا باسم كتل، Backscanner، StockFinder). الذي يكون مجموعتين من البيانات ولكني أردت مصدر مستقل حتى لقد فعلت ذلك لدراسة البيانات التاريخية سعر 8220؛ chain8221 الغذاء ؛. لتلخيص، ينشأ كافة البيانات من التبادلات والشركات البيانات التقاط البيانات كما ذكرت من قبل التبادلات. يتم تقديم البيانات التي تم التقاطها لإعادة بيعها (بالاتفاق مع تبادل). أعجب CSI البيانات لي لأنها تقدم بيانات عن مواقع كبيرة مثل ياهو، ام اس ان، وجوجل وأعتقد أن ملايين العيون على بيانات ستساعد استئصال الأخطاء. أيضا، عرضت CSI البيانات البيانات شطب، الذي يعطي وجهة نظر أكثر دقة لbacktesting. (وبأسعار CSI البيانات لأن البيانات شطب بعيدا عن متناول معظم الأفراد، بمجرد أن أدركت كم المؤسسات أن تدفع ثمن ذلك. أنا أشعر بأنني محظوظ جدا قد حصلت على 14 سنوات من البيانات شطب لمجرد الأرقام الأربعة.) الخطوة 2: تفريغ البيانات. للحصول على بيانات الأسعار التاريخية جاهزة للمقارنة، تحتاج إلى تفريغ عليه للخروج من أدوات البرمجيات. Telechart يجعل من الأسهل مع تصدير إلى نص القدرة تحت بند القائمة بنك المعلومات. CSI بيانات مرنة للغاية حول كتابة البيانات أيضا. TradeStation لا يوجد لديه منشأة للكتابة من البيانات. كان لي لإنشاء برنامج نصي لغة سهلة بسيطة أن يكتب إغلاق العليا والدنيا، فتح، وبلغ حجم التداول لكل يوم إلى ملف نصي عن كل رمز. رمز شريط هو اسم الملف النصي ولم يتم سرد داخل الملفات. الحرص على مطابقة تنسيق في كل ثلاث مجموعات من البيانات. كتبت الألغام في هذا النظام: التاريخ، C، H، L، O، V. من المهم جدا للاستخدام دائما البيانات المعدلة الانقسام. كلمة أخرى للحكيم: كل بائع تستخدم وحدات مختلفة للقياس لحجم تحتاج إلى ضبط وفقا لذلك. الخطوة 3: كتابة برنامج لمقارنة البيانات. مع برامج مثل tkdiff متاحة مجانا على شبكة الإنترنت، وأعتقد أن هذه الخطوة تكون سهلة، ولكنني اعتقدت خطأ! أولا وقبل كل شيء، مع ما يقرب من 7500 آلة ل، فإنه يأخذ الطريق طويلا لتحميل الملفات يدويا إلى tkdiff. كنت بحاجة لأتمتة المقارنة. مرة واحدة الآلي، وجدت أن الاختلافات الطفيفة من بنس واحد أو اثنين تحدث كل أسبوع تقريبا. (يمكن أن يحدث هذا، على سبيل المثال، إذا كان بائع واحد يأخذ إغلاق كثمن أعدم الماضي، ويستخدم بائع آخر وسط انتشار الماضي بين العرض والطلب السعر كما إغلاق.) I بسرعة كبيرة قررت أن لم أكن أريد أن أعرف عن الفروق الصغيرة في البيانات بين البائعين الثلاثة. الذي ليس ستكون لدينا تأثير جوهري على النتائج backtesting. ما يهم، ومع ذلك، هو الفجوات الضخمة التي تفجرت من وقت لآخر. لتحديد تلك، كتبت برنامج فرق غامض. فإنه يقارن بيانات من اثنين من البائعين والأعلام سوء يقارن والفرز في أخطاء كبرى (القيم التي هي أكثر من 0.04 $ إيقاف)، الأخطاء الطفيفة (أقل من 0.04 $) وعدم وجود أخطاء. ركضت فرق غامض مرتين: مرة واحدة مقارنة CSI وTradeStation، ومرة أخرى مقارنة مجموعات البيانات CSI وردين. الخطوة 4: تحليل سوء يقارن. أثمرت الخطوة السابقة على قائمة من نقاط البيانات الثمن الذي لم مقارنة بين البائعين. أنا بشق الأنفس بحثت كل من الأخطاء الكبرى، والنظر في جداول الأسعار اثنان والبحث في الأخبار على شريط في وقت قريب من الخطأ. في معظم الحالات، كان واضحا والتي كانت مجموعة البيانات الخاطئ. الخطوة 5: ملاحظات للبائعين البيانات. قررت أن أكون مواطنا صالحا ويقدم معظم الأخطاء البيانات أنني قد وجدت. كان CSI بيانات أقل عدد من الأخطاء، استجابت على الفور لتعليقاتي ودافع عموما من صحة البيانات الخاصة بهم. TradeStation لديها كادر متخصص أن يدقق بسرعة وإصلاح كافة الأخطاء I عنها. كان ردين على معظم الأخطاء ولم يكن ليستجيب على الإطلاق عندما أشرت بها. وغني عن القول، وأنا قلقة جدا من استخدام البيانات ردين الآن. خطوة 6: حدد بيانات الأسعار التاريخية النهائية. في النهاية، خطرت لي على القائمة النهائية للمؤشرات الأسهم. وكان هناك عدد قليل من آلة لالصارخة سوء يقارن ولا الجاني واضحة لذلك أنا حذفها من قائمتي. فقد وقع اختياري على مجموعة تنظيفها من البيانات CSI (بالإضافة إلى البيانات شطب المسحوب الامم المتحدة) كما بلدي الذهبي التاريخي مجموعة بيانات الأسعار. وأظل التي أغلقت في دليل منفصل لتجنب التغييرات غير مقصودة. (الباعة تحديث البيانات على الأقل يوميا ويمكن إصلاح الأخطاء، وحتى إصلاح غير مرحب به مرة واحدة يبدأ backtesting تحتاج كل استراتيجية لأداء بالضبط على نفس البيانات لإجراء مقارنات بين الاستراتيجيات.) خطوة 7: تغذية بيانات الأسعار ذهبية لمحرك backtesting. TradeStation، يا محرك backtesting الاختيار، يعمل على البيانات الخاصة به بشكل افتراضي. لاستخدام بيانات خارجي، لديك لاستخدام رمز Lookup - & GT؛ علامة حزب 3 للإشارة إلى البيانات وأيضا إعداد السمة والنظام بيانات المعلمة الملفات لأقول TradeStation كيفية قراءتها. انظر ملفات المساعدة TradeStation ضمن بيانات الحزب 3 للحصول على تعليمات كاملة. هذه عملية شاقة يساعدك على الحصول على دقيقة ونتائج ذات جودة عالية من backtesting. 2 الردود على 8220؛ كيف لتنظيف بيانات الأسعار لBacktesting8221. بات شوكة | 4/02/10 أنا مبرمج جديدة لفوركس وكان الأكثر اهتماما في التقييم الخاص بك MACD كمؤشر، لقد قرأت الكثير عن هذا المؤشر على شبكة الإنترنت. لقد وجدت اذا كنت الجمع بين MACD مع مؤشر ستوكاستيك السريع ومن المدهش نتائجي حتى الآن، لا يزال تحليل، طعاما للعض الرصاصة بعد. وانا ذاهب لبدء هذا الاثنين القادم. هي البيانات backtesting الخاص القراد الفعلية أو السعر في الوقت الذي يحدث بدلا من فتح، إغلاق، وارتفاع وانخفاض في إطار زمني؟ من وات لقد قرأت وأعتقد أنه هو. كونه مبرمج أن يعرف قليلا عن استخراج البيانات أستطيع أن نقدر كمية من الوقت والجهد لديك المنفقة. أهنئ مثابرة الخاص بك. إذا startegy بلدي كما هو موضح أعلاه يعمل، ولدي لك الشكر على ذلك. backtester | 4/02/10 شكرا لتعليقات كريمة الخاص بك. أتمنى لكم التوفيق مع التداول الخاصة بك، مهما كانت الاستراتيجية التي تختارها. البيانات backtesting بلدي هو كل نهاية اليوم، المفتوحة فقط، العليا والدنيا، إغلاق. في الغالب backtests بلدي تدخل السوق على توسيع باستثناء وقف الخسائر ولذلك فمن المسلم به الخشنة. إيف حصلت على المزيد من المعلومات حول MACD (كما ينطبق على الأسهم) في truthaboutmacd لم يتم تطبيق MACD لسوق المال. سعيد لسماع كنت backtesting وتقييم الوضع جيدا قبل المخاطرة النقدية.
No comments:
Post a Comment