Loading...
Please wait, while we are loading the content...
Predicción de valores de bolsa mediante minería de datos para mercado de alta frecuencia
| Content Provider | Semantic Scholar |
|---|---|
| Author | Villalmanzo, Isabel Vegas |
| Copyright Year | 2016 |
| Abstract | En los mercados bursatiles de alta frecuencia se opera a traves del High Frecuency Trading (HFT). Este se caracteriza por el uso de ordenadores que aplican algoritmos informaticos que analizan e interpretan las senales y condiciones del mercado a gran velocidad; y, en respuesta a las mismas, introducen ordenes de compra y venta en el mercado de manera automatica en un periodo de tiempo muy corto. La velocidad de procesamiento de estas operaciones actualmente ronda los milisegundos. Por lo tanto, para ser considerado un High Frecuency Trader se debe emplear tecnologia con muy baja latencia (tiempo que pasa desde que se trasmite la orden hasta que esta se ejecuta), una conexion de alta velocidad y bajo retardo al mercado para la introduccion de ordenes, y un alta tasa de envio de ordenes y cancelacion de las mismas. Una de las principales estrategias competitivas de los High Frecuency Traders es la disminucion de la distancia entre el servidor de la plataforma de negociacion y el suyo propio. Asi, se reduce el tiempo de conexion, con lo que se puede operar con mayor agilidad y rapidez al reducir la latencia de las ordenes hasta tiempos de respuesta menores de una centesima de milisegundo. Para conseguir esto, hay que utilizar los servicios de co-location que ofrecen las propias bolsas. La unica manera de conseguir una ventaja competitiva sera mejorando los algoritmos informaticos que analizan e interpretan las senales del mercado, y tratando asi de predecir como va a evolucionar este para poder posicionarte antes que tus competidores. Para lograrlo, se va a emplear la mineria de datos, que consiste en el estudio y tratamiento de datos masivos para extraer conclusiones e informacion relevante. Mediante estos procedimientos, se analizaran los datos historicos intradia de diferentes valores bursatiles para encontrar los patrones de comportamiento y las relaciones entre ellos que se producen a lo largo del tiempo. Y asi, desarrollar un modelo de prediccion que sea capaz de estimar a unos pocos minutos los precios de estos valores. La primera fase del proceso de mineria de datos consiste en la preparacion de estos para mejorar la calidad del conjunto de datos, y poder elaborar un modelo que genere mayor y mejor informacion. Los datos de los que partimos son series temporales de precios intradia de diferentes valores de la bolsa de Madrid, a lo largo de un mes. A continuacion, se exploran los datos previamente preparados para determinar si la informacion que nos proporcionan, a priori, sirve a nuestro proposito que es elaborar un modelo de prediccion de precios de valores bursatiles. Posteriormente, se realizara un estudio de las correlaciones entre los distintos valores bursatiles, con el fin de analizar si existen relaciones entre ellos, mediante la correlacion lineal de Pearson. En este estudio de las correlaciones, se realizan 5 experimentos distintos. En cada uno de ellos se ha escogido una muestra de un dia de actividad bursatil, de forma que cada experimento sea lo mas aleatorio posible; y asi, tener una idea general de las relaciones que hay entre los valores a lo largo del mes. Como resultado de este estudio, podemos afirmar que existe una relacion lineal, en mayor o menor medida, entre los distintos valores bursatiles. Ademas, la correlacion entre ellos puede mejorar al mover hacia delante o hacia atras en el tiempo (lag positivo o negativo) la serie temporal de precios de un valor respecto al otro. De esta forma, un valor podria ser predictor adelantado del valor que se quiere estimar, pudiendo ser esta relacion util a la hora de elaborar el modelo de prediccion. Ya conociendo mas a fondo los datos que vamos a utilizar, podemos pasar a la elaboracion del modelo. Un modelo de mineria de datos consiste en el analisis de una estructura de datos, mediante el uso de un determinado algoritmo, para extraer patrones y reglas que, a su vez, pueden aplicarse a otros datos para obtener informacion. Para lograr el mejor modelo de prediccion vamos a analizar diferentes casos: variando el numero de valores a predecir en el tiempo, el algoritmo usado, o el tamano de la estructura de datos a entrenar. Todas estas opciones de estructura de datos se evaluaran con los siguientes algoritmos: lineal, maquina de vectores de soporte y random forest. Una vez se han elaborado y validado todos los casos de modelos de mineria de datos previamente descritos, se analizan los resultados conseguidos. Algunas de las conclusiones obtenidas son: - El error obtenido es manejable desde un punto de vista operativo, situandose en torno a 0.002-0.04, equivalente al 0.03-0.6%. - Los modelos no lineales ofrecen mejores resultados que los lineales. Siendo significativamente menor el error de prediccion al emplear el algoritmo no lineal random forest en todos los casos. - En general, los modelos muestran limitaciones a la hora de predecir un cambio abrupto de tendencia, aumentando el error en estos casos. - Los modelos de prediccion a 5 minutos estiman notablemente mejor estos cambios de tendencia que los que son a mas tiempo (10, 15 y 20 minutos). - Es conveniente emplear modelos que incluyan los precios de un valor correlacionado con el que se quiere estimar, ya que mejoran el modelo en mayor o menor medida. Ademas, pueden ayudar a predecir mejor los cambios bruscos de tendencia. |
| File Format | PDF HTM / HTML |
| Alternate Webpage(s) | http://oa.upm.es/43108/1/TFG_ISABEL_VEGAS_VILLALMANZO.pdf |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |