Foto cortesía: shapecharge/iStockPhoto
Empresas, científicos e investigadores de todo el mundo utilizan bases de datos para realizar un seguimiento de la información. Las bases de datos pueden ser útiles para todo, desde enviar una postal a todos sus clientes hasta descubrir los resultados de un estudio científico.
Sin embargo, los datos se vuelven menos valiosos cuando no son confiables. La inconsistencia de los datos es una de las amenazas más comunes para los datos confiables. ¿Qué es la inconsistencia de datos y qué problemas causa?
¿Qué es la inconsistencia de datos?
Foto cortesía: Yudram_TA/iStockPhoto
Para usar los datos, deben registrarse en un formato que facilite la lectura y el seguimiento. Muchas empresas utilizan bases de datos electrónicas para rastrear y almacenar grandes lotes de datos. Especialmente para grandes empresas o estudios extensos, el tamaño de la información a rastrear puede ser mucho mayor de lo que cabe en un archivo o incluso en una computadora.
Las inconsistencias de datos surgen cuando los datos que deberían estar en una base de datos terminan en varios archivos, cada uno con una versión diferente de la misma información. Las mismas entradas pueden estar en la base de datos varias veces. Puede haber varias versiones de la misma base de datos donde una versión incluye campos que faltan en otra versión. El resultado es un conjunto de datos que no es preciso ni fácil de usar.
¿Qué causa la inconsistencia de datos?
Foto cortesía: Drazen_/iStockPhoto
Aunque la tecnología facilita el seguimiento de los datos, el uso inadecuado de la tecnología suele ser el culpable de la inconsistencia de los datos. Varias personas pueden colaborar para crear el mismo conjunto de datos, pero es importante asegurarse de que todas las personas editen el mismo archivo. Cualquier cambio debe ser visible para todos los demás colaboradores en tiempo real. También debe haber una fuente de datos consistente y confiable para ingresar a la base de datos. Causaría inconsistencias en los datos si diferentes personas extrajeran datos de las mismas fuentes. También daría lugar a datos redundantes e incoherentes si una o más de las personas que trabajan en las bases de datos no pudieran ver o realizar un seguimiento de las actualizaciones realizadas por otros.
Por ejemplo, suponga que cuatro compañeros de trabajo están creando una base de datos de las direcciones de correo electrónico de los clientes para una gran empresa. Algunos correos electrónicos provienen de un embudo de ventas. Otros provienen de un cupón de suscripción, y el resto de los correos electrónicos provienen de tres concursos diferentes. Si un compañero de trabajo está actualizando un archivo que solo se guarda en su disco duro, el resto del equipo no verá los cambios que realiza. A la base de datos final le faltarán las direcciones de correo electrónico que encuentre.
Si el resto de los empleados se suman a una base de datos almacenada en línea donde los cambios son visibles en tiempo real, ese es un paso en la dirección correcta, pero ¿qué pasa con sus fuentes de datos? Es posible que algunos clientes se hayan inscrito en los tres concursos. El simple uso de una lista de correos electrónicos de cada concurso daría como resultado que algunas direcciones de correo electrónico se enumeraran varias veces. La base de datos necesita reglas de programación para evitar entradas duplicadas.
Ya sean logísticos o tecnológicos, los problemas que pueden derivar en inconsistencias de datos tienen fácil solución. Sin embargo, debe ser consciente de los posibles problemas y desarrollar un plan que funcione. Para grandes conjuntos de datos en los que trabajan varias personas, se necesita una planificación cuidadosa para eliminar las inconsistencias de datos del proceso.
¿Por qué la inconsistencia de datos es un problema?
Foto cortesía: PixelsEffect/iStockPhoto
Aquí hay un ejemplo de la vida real de inconsistencia de datos en una escala mucho más pequeña. Supongamos que Jack, Ann y Sheldon están trabajando en un proyecto grupal y necesitan escribir un ensayo juntos. Trabajaron juntos en la biblioteca y necesitaban terminar la última página del ensayo durante el fin de semana. Jack escribió el archivo original en su computadora portátil. Envía el archivo por correo electrónico a sus socios de proyecto como un documento de Word.
Jack continúa editando su documento de Word después de enviar un correo electrónico a sus socios. Ann carga la información en un documento de Google, que ella y Sheldon editan en tiempo real. Al final del fin de semana, hubo dos periódicos diferentes. Jack tiene una versión del documento en el que trabajó. Ann y Sheldon tienen otra versión del artículo. Ambos papeles tienen tres de las mismas páginas, pero la cuarta página es diferente. Ahora, a ambos documentos les falta información. El grupo tendrá que reunirse nuevamente para decidir qué información de ambos documentos usar.
La inconsistencia de los datos es mucho más grave en los negocios y la ciencia que hacer un poco de trabajo extra en un artículo. La inconsistencia de los datos es un gran problema porque las personas toman decisiones basadas en datos. Los datos inexactos resultan en una mala toma de decisiones. Supongamos que una base de datos recopila respuestas en un estudio sobre un nuevo medicamento. Si las inconsistencias cuentan dos veces 1.000 resultados positivos, podría salir al mercado un medicamento que en realidad no funciona. Si una empresa utiliza una base de datos inconsistente para enviar catálogos por correo a los clientes, la empresa podría desperdiciar miles de dólares enviando varios catálogos al mismo hogar.
Cómo prevenir inconsistencias de datos
Foto cortesía: pixelfit/iStockPhoto
Hay un término en tecnología que dice, basura adentro, basura afuera. Si coloca información incorrecta en una base de datos, la base de datos solo puede devolverle información incorrecta. Una de las formas más sencillas de evitar las incoherencias en los datos es crear reglas en la hoja de cálculo u otro software de base de datos que se utilice para realizar un seguimiento de los datos.
Las inconsistencias de los datos generalmente dan como resultado uno de dos problemas: datos duplicados o faltantes. La planificación y la gestión de proyectos pueden evitar la falta de datos. Por ejemplo, una empresa puede establecer una política para que todos los empleados usen el mismo software en línea que se actualiza en tiempo real. Esto evitará que los empleados guarden docenas de iteraciones de la misma base de datos en sus propias computadoras. Las reglas de la base de datos ayudan a identificar las inconsistencias de los datos y las eliminan antes de que influyan en los resultados y las decisiones. El software específico de la industria tiene métodos altamente sofisticados para reconocer duplicados. Incluso el software de hoja de cálculo más básico se puede programar para detectar errores.
Comprender qué son las inconsistencias de datos es la clave para comprenderlas y prevenirlas. Como dice el dicho, más vale prevenir que curar. Es mucho más fácil corregir las causas de la inconsistencia de los datos que mejorar la amplia variedad de problemas que surgen de ella.
La inconsistencia de datos es una situación en la que hay varias tablas dentro de una base de datos que manejan los mismos datos pero pueden recibirlos de diferentes entradas. La inconsistencia generalmente se ve agravada por la redundancia de datos.
¿Qué es la inconsistencia de datos con el ejemplo?
La redundancia de datos conduce a la inconsistencia de datos. Ejemplo – Si tenemos una dirección de alguien en muchas tablas y cuando la cambiamos en una sola tabla y en otra tabla puede que no se actualice entonces se puede presentar el problema de la inconsistencia de datos.
¿Qué significa la consistencia de los datos?
La coherencia de los datos significa que cada usuario ve una vista coherente de los datos, incluidos los cambios visibles realizados por las transacciones del propio usuario y las transacciones de otros usuarios.
¿Qué quiere decir con redundancia de datos e inconsistencia de datos?
La redundancia de datos ocurre cuando el mismo dato existe en varios lugares, mientras que la inconsistencia de datos ocurre cuando los mismos datos existen en diferentes formatos en varias tablas. Desafortunadamente, la redundancia de datos puede causar inconsistencias en los datos, lo que puede proporcionar a una empresa información poco confiable y/o sin sentido.