Estructura de un formulario de lectura óptica

La estructura del formulario de lectura óptica (a veces denominado también hoja para lectora óptica) se basa en 3 elementos fundamentales clocks, columnas y casillas de marca que se describen a continuación:

  1. Clocks:
    • Son las marcas rectangulares en tinta negra en uno de los bordes de la hoja, usualmente en el lado derecho.
    • Cada marca señala una línea de lectura, esto es, su existencia indica a la lectora una fila en la que puede haber casillas de marcas para lectura.
    • Si una fila tiene casillas de marca, pero no tiene su clock asociado, entonces dichas casillas nunca serán leídas.
    • Si los clocks de un formulario están deteriorados o sobre-escritos, entonces, lo esperable, es que la lectora tenga problemas de sincronismo al leer dicho formulario.
    • La distancia entre clocks, tradicionalmente, ha sido de 1/6 de pulgada. Se empleaba esta distancia por compatibilidad con las antiguas impresoras de carro que, a veces, se utilizaban para rellenar de forma previa algunas casillas de determinados formularios para personalizarlos, por ejemplo, marcando el DNI para cada persona que iba a rellenar el formulario en un examen u oposición.
    • Pero realmente, la distancia entre clocks puede ser cualquiera, por ejemplo, de 1/5 de pulgada u otras distancias.
    • El máximo de clocks para los formularios en hojas DIN A4 es de 70 y el máximo de clocks para los formularios en folio es de 74, si bien hay que hacer notar que llevar al máximo el número de clocks aumenta la probabilidad de errores, por lo que los máximos habituales para una DINA A4 suelen estar entre 52 y 64 clocks.
  2. Columnas:
    • La lectora posee un conjunto de sensores con fotocélulas (o células fotoeléctricas), un sensor por cada columna formando una línea de sensores.
    • Es por ello que también se les denomina canales de lectura (bajo cada canal pasan todas las casillas de su columna) y al conjunto de sensores con fotocélulas peine de lectura.
    • Las lectoras pueden tener un peine para leer formularios a una sola cara o dos peines para leer formularios impresos y rellenos por las dos caras.
    • Los sensores con fotocélulas sirven para leer las casillas de marca que se ponen en el formulario de lectura.
    • Lo usual en Europa es que los peines de lectura vengan preparados para formularios de 40 columnas, a intervalos de 1/5 de pulgada, pero también hay peines con 48 columnas, a intervalos de 1/6 pulgada, más habituales en los Estados Unidos.
    • Por lo que podemos considerar que para las lectoras ópticas europeas la distancia entre canales de lectura es fija y corresponde a la distancia entre sensores con fotocélulas de 1/5 de pulgada.
    • Todos los ejemplos de formularios que pueden consultarse en OMRForms.es correspondes a distancias de 1/5 de pulgada entre columnas.
    • Es por ello, que si la distancia entre clocks se pone también a 1/5 de pulgada, entonces las casillas de marca se conforman como una cuadrícula exacta.
  3. Casillas de marca:
    • Cada casilla queda definida por su fila y su columna y son el sitio donde las personas que rellenan el formulario ubican sus marcas a bolígrafo o lápiz dependiendo de lo que deseen contestar.
    • Toda marca que esté fuera de estas casillas de marca, bien de forma intencionada para señalar algo o por error, no será leída por la lectora óptica.
    • Los bordes de las casillas se han de imprimir con una tinta que no sea visible para los sensores con fotocélulas. Esto es, una tinta que carezca de componente negro. Por ejemplo, algunas tintas naranjas (que es el color que recomendamos en OMRForms.es) y también tintas rojas e, incluso, tintas rosas.
    • En la siguiente imagen pueden verse los clocks en tinta negra y una matriz de las casillas de marca en tinta naranja, organizada por filas y columnas.
Los clocks, las columnas y las casillas de marca componentes fundamentales OMR

Detalle de la estructura de los formularios OMR

La siguiente figura muestra un formulario OMR en detalle dentro del cual pueden identificarse los elementos siguientes:

  • Los campos para la información escrita, nombre, apellidos y fecha, que no se leen junto con el área para firmar.
  • El campo para la introducción del DNI junto con un ejemplo de DNI ya marcado a su izquierda.
  • Otros campos para la introducción del número, el tipo de examen, el grupo y la sección.
  • Un ejemplo de cómo se han de rellenar las casillas de marcas y cómo no hay que hacerlo.
  • La columna vertical de clocks a la derecha del formulario, cada fila con casillas de marcas útiles tiene su clock a la derecha.
  • Una fila horizontal de casillas ya marcadas en negro previamente en imprenta que tienen una doble función, separar visualmente el área de identificación de la persona de, en este caso, el área de examen.
  • Un área de examen con hasta 150 respuestas que pueden ser de 2 tipos, verdadero o falso o de tipo test con 5 opciones. Para facilitar la cumplimentación las 150 preguntas de examen se estructuran en 5 columnas y, dentro de cada columna, en grupos de 5 preguntas de hasta 5 respuestas.
  • Finalmente, abajo del todo, nuestra identificación de diseño e impresión de http://www.omrforms.es.

Los siguientes son artículos interesantes para profundizar más en las estructuras de campos a través de las cuales se realiza la lectura óptica y que son la base para el diseño de formularios OMR y la programación de su lectura.

Con todos sus campos de identificación de la persona, el examen, las opciones de respuesta, explicación de cómo rellenar, sus clocks, etc.

Campos como agregaciones de casillas de marcas ópticas

El objetivo de las siguientes figuras es introducir y mostrar el concepto de campos de casillas de marcas ópticas. Los campos pueden definirse como conjuntos estructurados de casillas para marcas ópticas.

Número de elementos y número de opciones: Los elementos son cada uno de los ítems que componen un campo y las opciones son cada una de las posibles respuestas que puede tener cada ítem.

Un buen diseño de un formulario OMR implica estructurar los conjuntos de casillas OMR con la semántica precisa

Posición de los campos dentro del formulario de recogida óptica de datos: La posición indica las filas de comienzo y final y las columnas de comienzo y final de los campos. Hay que tener en cuenta que hay campos sin posición, como por ejemplo son los de inserción, sensibilidad, etc., y que hay otros que basta con darles la fila y columna de comienzo, como los de ítems dispersos.

La posición indica las filas de comienzo y final y las columnas de comienzo y final de los campos

Orientación de los campos de casillas de marcas ópticas, orientación vertical y orientación horizontal: La orientación indica la dirección de lectura que tienen los campos. Hay que tener en cuenta que hay campos sin orientación, como por ejemplo, los de inserción, sensibilidad, etc.

La orientación indica la dirección de lectura que tienen los campos

Saltos entre casillas de marcas ópticas, saltos entre filas y saltos entre columnas: Los saltos indican el número de espacios en blanco entre las filas y columnas de los campos. El número más habitual es cero, esto es, sin espacio entre filas y entre columnas. Pero si se dispone de espacio en el formulario OMR dejar saltos, por ejemplo, 1 ó 2, facilita a las persona el relleno del formulario y suele contribuir a disminuir el número de confusiones. Como en el caso anterior, hay que tener en cuenta que hay campos sin saltos, como los de inserción, sensibilidad, etc.

Los saltos indican el número de espacios en blanco entre las filas y columnas de los campos

Campos de múltiples marcas, concepto: Indica si en el campo puede haber más de una respuesta a cada pregunta. De ser así, la longitud de estos campos se ha de calcular como (nº de elementos x nº de opciones) x longitud de la máscara.

Indica si en el campo puede haber más de una respuesta a cada pregunta

Campos de múltiples marcas, ejemplo con la selección de fútbol:

Campos de múltiples marcas ópticas, ejemplo con la selección de fútbol

Número de caracteres por marca: Es la longitud de la cadena de respuesta para cada opción del elemento en el campo, es decir, qué es lo que se quiere que la lectora interprete cuando lee una marca. El siguiente ejemplo muestra la lectura del DNI (Documento Nacional de Identidad) y de los meses del año.

Es la longitud de la cadena de respuesta para cada opción del elemento en el campo

Clases de campos en hojas para captura óptica de datos

Las siguientes figuras muestran diferentes tipos campos para la captura de datos con una lectora óptica. Dependiendo del tipo de datos que es necesario recoger y de las personas que han de rellenar los formularios se han de seleccionar las estructuras más convenientes en cada caso.

Múltiples opciones: El campo de múltiples opciones puede ser usado para definir zonas que requieran una opción, o más, de entre varias posibles respuestas. Este campo tiene una geometría rectangular, con una de las esquinas especificadas por fila y columna que define la primera opción del primer elemento y otra de las esquinas, especificada también por fila y columna, que define la última opción del último elemento. A continuación se muestra un ejemplo con una marca válida por columna para la lectura del DNI (Documento nacional de identidad):

Múltiples opciones puede ser usado para definir zonas que requieran una opción, o más, de entre varias posibles respuestas

Múltiples opciones, con una marca válida por fila: retornando "?" en caso de doble, triple,... marca, como sucede en la novena fila de casillas de marcas. Su uso más frecuente es para la codificación de un campo de test en el cual sólo se admite una respuesta por pregunta.

Para la codificación de un campo de test en el cual sólo se admite una respuesta por pregunta

Múltiples opciones, con varias marcas válidas por fila: retornando todas las marcas. El uso más frecuente es para la codificación de un campo de test en el cual se admite una o más respuestas por pregunta.

Para la codificación de un campo de test en el cual se admite una o más respuestas por pregunta

Identificación, concepto: La lectora puede detectar si está leyendo la hoja de respuesta correcta comparando el número de clocks leídos con el número de clocks que se especificó en el campo de parámetros y también comprobando las marcas de identificación impresas en la hoja. Estas marcas de identificación pueden estar dispuestas en la hoja horizontal o verticalmente, pero siempre formando una sola línea.

La lectora puede detectar si está leyendo la hoja de respuesta correcta comparando el número de clocks leídos

Identificador horizontal: Un campo de identificación horizontal no genera nada en el registro de salida, sólo provoca que la lectora óptica busque las marcas de identificación y rechace los formularios OMR que no se ajusten al modelo especificado.

Un campo de identificación horizontal no genera nada en el registro de salida

Identificador vertical: Un campo de identificación vertical no genera nada en el registro de salida, sólo provoca que la lectora óptica busque las marcas de identificación y rechace las hojas de respuesta que no se ajusten al modelo especificado.

Un campo de identificación vertical no genera nada en el registro de salida

ítems dispersos: El campo de ítems dispersos puede ser usado para definir zonas que requieran una opción, o más, ubicadas aleatoriamente en el formulario OMR, de entre varias posibles respuestas. Tiene una geometría irregular, por lo que hay que especificar la fila, columna y máscara de cada opción una a una. El siguiente ejemplo muestra la recogida del estado civil:

El campo de ítems dispersos puede ser usado para definir zonas que requieran una opción

ítems dispersos, ejemplo de la letra del NIF (Número de Identificación Fiscal):

ítems dispersos, ejemplo de la letra del NIF, Número de Identificación Fiscal, tipo de campo OMR

Bloque binario: Con este tipo de campo, también denominado binario en bloque, se podrá leer un sólo número codificado en binario en una zona de geometría rectangular, es decir, en un bloque.

Podrá leer un sólo número codificado en binario en una zona de geometría rectangular

Bloque binario, ejemplo del DNI (Documento Nacional de Identidad):

DNI, Documento Nacional de Identidad, ejemplo de Bloque binario / Binario bloque, tipo de campo OMR

Binario en línea: Con este tipo de campo se podrá leer uno o más números codificados en binario en una zona de geometría rectangular. Cada elemento del campo corresponderá a un número, por lo cual habrá tantos números como elementos tenga el campo.

Podrá leer uno o más números codificados en binario en una zona de geometría rectangular

Bloque en línea, ejemplo incluyendo un error de marcado (?):

Bloque en línea, ejemplo incluyendo un error de marcado (?)

Campos de control de la lectura óptica

El proceso de lectura óptica puede ser controlado a través de una serie de campos que determinan su comportamiento

Número de clocks en el anverso: Permite especificar el número de clocks o filas que tiene la hoja en la cara frontal. Permite valores entre 1 y 99.

Número de clocks en el reverso: Permite especificar el número de clocks o filas que tiene la hoja en la cara dorsal. Permite valores entre 1 y 99. Esta opción es sólo válida en lectoras con doble cabeza.

Número de códigos de barras a detectar: Establece el número mínimo de códigos de barras a ser detectados cuando se lean las hojas. Admite valores entre 0 y 10. Si es mayor que cero y la cantidad de códigos de barras leídos es menor que este valor la lectora generará un error.

Interpretación de autoreverse: Si esta opción está inactiva la lectora comprobará que la cara definida como frontal pase por la cabeza superior de lectura y la cara definida como dorsal pase por la cabeza inferior de lectura. Si está activa el orden de las caras al leer es indiferente. Esta opción sólo es válida para lectoras con doble cabeza.

Sensibilidad: Nivel se sensibilidad mínimo con el que vamos a leer las marcas. Cuanto más bajo sea este nivel mayor es la sensibilidad, es decir, más lee la lectora y cuanto más alto menor es la sensibilidad. El valor óptimo suele ser 25.

Discriminación: Establece la diferencia de nivel que debe haber entre dos marcas, o una marca y un borrado, para que opte por una de ellas. Cuanto mayor sea este nivel más acusada debe ser la diferencia, es decir menos discrimina. El valor óptimo suele ser 15.