El Crm por Albañiles IV: la Normalización

( 0 Votes ) 
2237
CRM
Domingo, 30 Julio 2023 15:31

Profundicemos con la piqueta y desgranemos los datos y parámetros que debe abarcar una normalización global y efectiva para nuestra Base de Datos.


¿A que ya casi os habíais olvidado del Albañil de Datos? Un poco de paciencia, sólo nos quedan 2 entregas, muy interesantes, estoy seguro. Hoy ponemos "sobre los planos" a la Normalización. ¿Recordáis cómo trató de definirla el Albañil en el artículo introductorio de esta serie, allá por Octubre del pasado año? Refresquemos la memoria.

"Normalización: Pensemos ahora en un constructor con una partida de ladrillos de diferentes medidas y tamaños para su edificio: ¿Qué caos, verdad? ¿Habéis descubierto alguna vez en vuestros datos, la misma calle o la misma localidad escritas de diferentes formas? ¿Y en diferentes lenguas? Seguro que sí. Entonces, ¡a escribirlas todas de la misma manera sobre la base de una norma!"

Debemos tener siempre en cuenta que nos encontramos ante un proceso, el tratamiento de datos, en el que se suceden varias fases. No debemos verlo nunca como acciones estanco sino como un proceso global. Hagamos un repaso rápido de las fases expuestas hasta ahora en anteriores entregas:

  1. Formateo
  2. Validación
  3. Y ahora. la Normalización

Volviendo a la Normalización, si nos quedásemos en ese primer piso de la definición anterior, tan "Light", y frecuentemente cometemos ese error, perderíamos la visión global del edificio y éste adolecería de la solidez suficiente. Profundicemos con la piqueta y desgranemos los datos y parámetros que debe abarcar una normalización global y efectiva. Os pido disculpas por el nivel de detalle, pero en este caso, creo que es necesario:

Normalización de Nombres - Medidas

- Identificación y separación de personas físicas y jurídicas
- Separación de nombres y apellidos en campos separados
- Adjudicación de sexo a personas físicas
- Palabras de enlace: Identificación, separación, depuración y asignación


Teléfonos - Medidas

- Eliminación carácteres alfa
- Elongación a 9 posiciones
- Normalización

 

Dirección - Medidas

- Separación de los componentes de la dirección en campos separados
- Estandarización del tipo de la vía
- Estandarización del nombre de la vía
- Estandarización del nombre de la población
- Estandarización y/o adjudicación del nombre de la provincia
- Validación de la numeración de la vía
- Adjudicación del código INE de la vía
- Adjudicación del código INE de la población
- Adjudicación del código INE del municipio
- Adjudicación del código INE del distrito censal
- Adjudicación del código INE de la sección censal
- Adjudicación de entidad singular de población
- Adjudicación de entidad colectiva de población
- Adjudicación de Área Mosaic
- Adjudicación de coordenadas geográficas (x/y)


Otros parámetros - Medidas

- Reconocimiento y tratamiento de errores de grabación
- Reconocimiento y tratamiento de confusiones fonéticas (bisnes=business)
- Reconocimiento y tratamiento de errores ortográficos
- Reconocimiento y tratamiento de variantes vernáculas (Joan=Juan)
- Reconocimiento y tratamiento de hipocorísticos (Paco=Francisco)



Hemos mencionado la palabra norma o estándar, pero, ¿quién marca la norma? Pues aquí la respuesta no es sencilla, sino más bien compleja. Podemos admitir como punto de partida que deberíamos acudir a un estándar público o reconocido de forma general. En esta línea, podemos citar a manera de inventario fuentes como Correos, el Instituto Nacional de Estadística (INE), los directorios telefónicos, los registros civiles y mercantiles de la Administración Central del Estado, CCAA y Ayuntamientos; Cámaras de Comercio, organizaciones gremiales y profesionales, entidades privadas de normalización, etc.

En cada caso, debemos elegir el estándar a utilizar; En ocasiones será el estándar público y/o mayoritariamente reconocido, oficial o privado. En otras, podremos crear nuestro propio estándar. La decisión se basará siempre en nuestra personalidad empresarial y en los objetivos de nuestra compañía.

Y ahora que tenemos claros todos lo parámetros que tenemos que vigilar y sobre los que tenemos que actuar, unos segundos de reflexión, un check list rápido de claves a tener en cuenta antes de empezar:

  1. Elección equipo humano
  2. Elección hardware y software adecuados
  3. Planificación
  4. Seguimiento

Y no olvidemos nunca que debemos tener muy claro lo que supone el normalizar nuestros datos, en cuanto a medios requeridos y coste directo-indirecto. Una correcta evaluación de estos factores nos debe ayudar a tomar la decisión más rentable sobre:

  1. ¿Proyecto interno o outsourcing?
  2. ¿A por todos los datos o sólo algunos segmentos?

Gracias por vuestra atención, nos volveremos a ver el mes que viene cerrando la serie y colocando por fin la bandera en la cubierta del edificio, con el apasionante tema: La Deduplicación. Hasta pronto. 

{kaslimemberprofile}profile=https://es.linkedin.com/in/antoniogarciadesoto | connections=show | format=inline | text=Antonio García de Soto{/kaslimemberprofile}

Base Sur Digital

Base Sur Digital

- Email address: hola@basesur.ar Sitio web: https://basesur.ar/