En el Departamento de Business Intelligence de SONDA hemos venido desde hace algún tiempo balanceando ambos aspectos, el técnico y el de negocios en las soluciones de Data Mining que hemos estado implementando. Nuestros clientes están muy interesados en saber cuánto es posible ahorrar mensualmente con nuestras aplicaciones basadas en Data Mining.
Técnicamente, utilizamos la metodología CRISP-DM para diseñar y construir cualquier aplicación que se base en el proceso de Data Mining, siguiendo los seis pasos:
- Entendimiento del problema,
- Entendimiento de los datos,
- Preparación de los datos,
- Modelado,
- Evaluación e
- Implantación
La experiencia con la que hemos contado para el diseño y construcción de las aplicaciones basadas en el proceso de Data Mining, siguiendo esta metodología, ha sido de nivel mundial. Esto lo valida la buena recepción que recibió nuestro sistema FraudScanning® para la detección temprana de licencias médicas fraudulentas y abusivas en el sector salud aplicado en la Isapre Banmedica.
Este caso fue presentado a la comunidad internacional de profesionales e investigadores en Business Intelligence en uno de los salones del Monte Carlo Resort & Casino de Las Vegas, Nevada, E.E.U.U., donde se realizó la Conferencia Internacional en Data Mining 2006 (DMIN’06). Dentro de los elogios recibidos destacan el modelado concebido en la solución propuesta y la retroalimentación entre entidades. Cabe destacar que la mayor parte de los asistentes a esta conferencia provenían de países tales como China, Inglaterra, Alemania, EE.UU., Francia, Finlandia e India, quienes aplican y desarrollan soluciones de Business Intelligence de primer nivel.
Metodología CRISP-DM
Nuestra propuesta de sistema de detección de fraudes y abusos utiliza un conjunto de Redes Neuronales Supervisadas MLP para cada una de las entidades envueltas en el problema: licencias médicas, afiliados, profesionales, médicos y empleadores. Esta estrategia de “dividir y conquistar” nos ha permitido retroalimentar la información a través del tiempo, combinando los comportamientos de los afiliados, médicos y empleadores.
Las redes MLP han sido las más difundidas en la literatura. Dentro de sus capacidades destaca la posibilidad de actuar como aproximadores universales de cualquier función matemática. A pesar de existir la posibilidad que los resultados de esta red caigan en mínimos locales de la solución, nuestros experimentos con MLP durante la etapa de Modelado de CRISP fueron similares a aquellos alcanzados con estrategias más sofisticadas como Support Vector Machines. De todas maneras, independiente de qué algoritmo utilizar en la etapa de Modelado, nuestra experiencia indica que el gran esfuerzo tiene que ser puesto en las etapas previas al Modelado cuando una aplicación basada en Data Mining se esté llevando a cabo.
Volver>>