ProRealTime
Zone de développement des applications API, des logiciels et utilitaires développés par les membres du forum
Répondre Page 1 sur 1

attention aux sources de données boursières

par ticktack » 01 Oct 2017 18:39

J'utilise pour backtester mes robots les données de chez quantconnect mais il y a des tas de bugs à contourner pour arriver utiliser leur données (à se demander même si c'est volontaire chez eux) ...

1) Entre 2 téléchargements (à quelques semaines d'intervalle) le format du fichier csv pour un même instrument peut varier (la backward compatibilité ils s'en tapent)

2) Entre 2 instruments différents le format peut être différent (la cohérence des données ils s'en tapent)

3) Certains fichiers sont buggés (la valeur du dax par exemple être multipliée par 10000 mais uniquement pour certaines journées) : là je ne sais même pas quoi dire ... c'est du n'importe quoi ...

Bref on voit tout le sérieux de la boite ... :twisted:

Alors certes 1$ pour télécharger autant de données que l'on veut en UT1 c'est pas cher mais ce genre de changements aléatoires c'est intolérable ... donc qu'ils augmente un peu leur tarif mais qu'ils vérifient/retraitent leur données avant de les mettre à disposition.

Re: attention aux source de données boursières

par swingwin » 01 Oct 2017 18:43

Change de sources de données.
Il y a des sources de données très fiables, mais il faut prendre le temps de chercher les données tous les jours.
La récupération de données me prend environ 30 minutes chaque jour, donc c'est un travail monstrueux.
Tu ne t'imaginerais pas la quantité de données dont je dispose et c'est du fiable.
mais j'y consacre pas mal de temps.

Re: attention aux source de données boursières

par Benoist Rousseau » 01 Oct 2017 18:55

Pas faute de l’avoir dit

Re: attention aux source de données boursières

par ticktack » 01 Oct 2017 21:39

swingwin si tu as une source fiable au moins pour le dax30 UT1 ça m'intéresse

Re: attention aux source de données boursières

par Jim » 01 Oct 2017 22:42

J'ai lu dans un bouquin d'Ernest Chan que 50% du travail des quants est de corriger les erreurs de données des bases de tests employées.

50% !!!


J'utilise les flux PRT, et ça ne représente que 2% du temps de mon trading quotidien.
Sur indice ils sont assez propres, mais sur action il y a du déchet.

En parlant de ça, je vais passer là 30 minutes à calculer mes points pivots, pour demain, la semaine et le mois. Ma confiance en PRT est limitée...

Re: attention aux source de données boursières

par ticktack » 01 Oct 2017 22:49

Oui ca ne m'étonne pas ... vu les datas que j'ai eus jusqu'à maintenant.

J'ai oublié un autre bug: bien entendu il y a des journées entières manquantes donc ça entraine des faux gaps mais j'ai considéré qu'en moyenne il y aurait autant de faux gaps haussiers que baissiers dus à des journées manquantes.

Re: attention aux source de données boursières

par floalsace » 12 Mar 2018 02:09

il y avait des erreurs dans chaque source de données que j'ai exploitées. Aussi bien en utilisant historical data downloader (fxcm), donnée de dukascopi, ou des data futures acheté chez un fournisseur qui garantie des données de haute qualité, impossible d'avoir quelque chose qui tient la route, il manque des 1/4 d'heures, des heures, voir des dizaines de journées

Re: attention aux sources de données boursières

par ticktack » 13 Mar 2018 00:48

Oui c'est pour ça que je n'accorde que aucun crédit aux systèmes qui ne passent que très peu de trades , il suffit de 2 ou 3 fausses données au mauvais moment et ça remet en question tous les backtests.

Quand on a des milliers de trades à moins d'avoir des données totalement corrompues on ne fausse les backtests que de manière marginale.

Articles en relation
Traitement de données ticks.
Fichier(s) joint(s) par Doudidoudou » 08 Avr 2018 22:38 (7 Réponses)
[Python] - Gestion des (flux de) données
par GTO » 14 Aoû 2016 15:20 (0 Réponses)
Amélioration des données de ticks récupérés
Fichier(s) joint(s) par ticktack » 27 Nov 2016 16:12 (13 Réponses)

ProRealTime

Alors partagez-le 5 fois c'est bon pour la santé