GUÍA de Implementación de la Política de Datos Abiertos GUÍA de Implementación de la Política de Datos Abiertos.
Al margen un sello con el Escudo Nacional, que dice: Estados Unidos Mexicanos.- Secretaría de la Función Pública.
GUÍA DE IMPLEMENTACIÓN DE LA POLÍTICA DE DATOS ABIERTOS
YOLANDA MARTÍNEZ MANCILLA, Titular de la Unidad de Gobierno Digital de la Secretaría de la Función Pública, con fundamento en los artículos 14 y 34, fracciones I, III y IX, del Reglamento Interior de la Secretaría de la Función Pública y artículo Tercero del Decreto por el que se establece la regulación en materia de Datos Abiertos.
CONSIDERANDO
Que el Decreto por el que se establece la regulación en materia de Datos Abiertos publicado en el Diario Oficial de la Federación el 20 de febrero de 2015, tiene el objeto de regular la forma mediante la cual los datos de carácter público, generados por las dependencias, entidades de la Administración Pública Federal, y las empresas productivas del Estado, se pondrán a disposición de la población como Datos Abiertos, con el propósito de facilitar su acceso, uso, reutilización y redistribución para cualquier fin, conforme a los ordenamientos jurídicos aplicables;
Que la Secretaría de la Función Pública es la encargada de definir la política de Datos Abiertos en el ámbito de las dependencias y entidades de la Administración Pública Federal, ello de conformidad con el artículo 37 de la Ley Orgánica de la Administración Pública Federal;
Que a la Unidad de Gobierno Digital, en el ejercicio de sus atribuciones le corresponde elaborar, instrumentar y dar seguimiento a la estrategia de Datos Abiertos generados o administrados por o en el ámbito de las dependencias y las entidades de la Administración Pública Federal; emitir criterios técnicos, metodologías, guías, instructivos o demás instrumentos análogos; dirigir y coordinar la formulación de los estudios necesarios en materia de Datos Abiertos y finalmente impulsar, promover y fortalecer la política de Datos Abiertos, así como proponer políticas en la materia, tal como lo establece el artículo 34, fracciones I, III y IX del Reglamento Interior de la Secretaría de la Función Pública;
Que el Artículo Tercero del Decreto que establece la regulación en materia de Datos Abiertos, señala que las dependencias y entidades de la Administración Pública Federal, y las empresas productivas del Estado, deberán observar las disposiciones que, en su caso, emita la Unidad de Gobierno Digital, en las que se establecerán las directrices para los Datos Abiertos en sus procesos de generación, recolección, conversión, publicación, administración y actualización en formatos abiertos;
Que en el Acuerdo del Consejo Nacional del Sistema Nacional de Transparencia, Acceso a la Información Pública y Protección de Datos Personales, por el que se aprueban los Lineamientos para determinar los catálogos y publicación de información de interés público, y para la emisión y evaluación de políticas de transparencia proactiva, publicado en el Diario Oficial de la Federación el 15 de abril de 2016, se establecen las características que deben cumplir los datos abiertos;
Que los datos de carácter público que genera o administra el gobierno, son activos de los mexicanos que, previendo el debido cumplimiento de las disposiciones legales en materia de acceso a la información y protección de datos personales, pueden ser utilizados por cualquier persona y para cualquier fin, de conformidad con los principios establecidos en los artículos 6, apartado A y 16, segundo párrafo, de la Constitución Política de los Estados Unidos Mexicanos;
Que los Datos Abiertos son los datos digitales de carácter público que son accesibles en línea, y pueden ser usados, reutilizados y redistribuidos, por cualquier interesado; y que cuentan con las siguientes características mínimas:
I. Gratuitos: se obtendrán sin entregar a cambio contraprestación alguna;
II. No discriminatorios: serán accesibles sin restricciones de acceso para los usuarios;
III. De libre uso: citarán la fuente de origen como único requerimiento para ser utilizados libremente;
IV. Legibles por máquinas: deberán estar estructurados, total o parcialmente, para ser procesados e interpretados por equipos electrónicos de manera automática;
V. Integrales: deberán contener, en la medida de lo posible, el tema que describen a detalle y con los metadatos necesarios;
VI. Primarios: provendrán de la fuente de origen con el máximo nivel de desagregación posible;
VII. Oportunos: serán actualizados periódicamente, conforme se generen;
VIII. Permanentes: se deberán conservar en el tiempo, para lo cual, las versiones históricas relevantes
para uso público, se mantendrán disponibles a través de identificadores adecuados para tal efecto.
Que los datos de carácter público, al ser puestos a disposición como Datos Abiertos, incrementan su potencial de uso, reutilización y redistribución, para:
1. Impulsar el crecimiento económico, fortalecer la competitividad y promover la innovación;
2. Incrementar la transparencia y rendición de cuentas;
3. Fomentar la participación ciudadana y fortalecer la democracia;
4. Detonar una mayor eficiencia gubernamental, diseño de política pública basada en evidencia y mejora de servicios públicos, en apoyo a los objetivos de desarrollo, generación de conocimiento y buena gobernanza, y
5. Al mismo tiempo, prevé el respeto a la privacidad y protección de los datos personales.
Que el 28 de octubre de 2015, México se adhirió a la Carta Internacional de Datos Abiertos, comprometiéndose a trabajar mediante la Política de Datos Abiertos para implementar los Principios de Datos Abiertos: 1) Abiertos por Defecto, 2) Oportunos y Exhaustivos; 3) Accesibles y Utilizables, 4) Comparables e Interoperables, 5) Para mejorar la Gobernanza y la Participación Ciudadana, y 6) Para el Desarrollo Incluyente y la Innovación.
Por lo anterior, se emite la siguiente:
GUÍA DE IMPLEMENTACIÓN DE LA POLÍTICA DE DATOS ABIERTOS
ÍNDICE:
I. Introducción.
II. Pasos, actividades y fechas de cumplimiento para las acciones establecidas en la Guía de Implementación de Datos Abiertos.
1) Paso 1 | Planea
1.1. Formar un grupo de trabajo y designar un Enlace y Administrador de Datos Abiertos.
1.2. Priorizar los datos de valor.
1.3. Generar, publicar y actualizar el Plan Institucional de Publicación de Datos Abiertos.
2) Paso 2 | Publica
2.1. Convertir los datos a formatos abiertos.
2.2. Incrementar la interoperabilidad y usabilidad de los Datos Abiertos.
2.3. Mejorar la disponibilidad y medios de distribución de los Datos Abiertos.
2.4. Documentar de acuerdo al estándar DCAT y publicar el Catálogo Institucional de Datos Abiertos.
3) Paso 3 | Perfecciona
3.1. Asegurar la disponibilidad de las URL utilizadas para publicar los Datos Abiertos.
3.2. Fomentar la calidad de los Datos Abiertos publicados.
3.3. Responder a los reportes ciudadanos de Datos Abiertos realizados mediante datos.gob.mx.
3.4. Asegurar el cumplimiento con la Política de Datos Abiertos.
4) Paso 4 | Promueve
4.1. Asegurar la generación, publicación y uso de Datos Abiertos en las herramientas y aplicativos digitales del gobierno.
4.2. Impulsar el uso de Datos Abiertos en la ciudadanía.
4.3. Establecer estrategias de comunicación digital.
III. Glosario.
IV. Transitorios.
V. Anexos.
Anexo I. Formatos para la Publicación de Datos Abiertos.
Anexo II. Ejemplo de uso del Marco Geoestadístico Nacional.
Anexo III. Ejemplo de elaboración de un diccionario de datos a partir de datos tabulares.
Anexo IV. Mecanismos de publicación automática de datos en CKAN.
Anexo V. Recursos en línea.
Para los efectos de la presente Guía, además de las definiciones establecidas en el Artículo Segundo del Decreto por el que se establece la regulación en materia de Datos Abiertos, se entenderá por:
ADELA: La plataforma digital para publicar en datos.gob.mx y dar seguimiento al cumplimiento de la Política de Datos Abiertos en cada dependencia, entidad o empresa productiva del Estado;
APF: La Administración Pública Federal;
Decreto: Decreto por el que se establece la regulación en materia de Datos Abiertos, publicado el 20 de febrero de 2015, en el Diario Oficial de la Federación;
Guía: La Guía de Implementación de la Política de Datos Abiertos;
Instituciones: La(s) dependencia(s) y entidad(es) de la Administración Pública Federal y las empresas productivas del Estado, y
OIC: El Órgano Interno de Control, homólogo o equivalente en las Instituciones.
I. Introducción.
Esta Guía de Implementación de la Política de Datos Abiertos sustituye a la versión publicada en el Diario Oficial de la Federación el 18 de junio de 2015, y está dirigida a las Instituciones responsables de cumplir con lo establecido en el Decreto, además, esta Guía ayudará a cumplir con la normatividad vigente con relación a la publicación y uso de Datos Abiertos como:
- La Ley General de Transparencia y Acceso a la Información Pública;
- La Ley Federal de Transparencia y Acceso a la Información Pública;
- Los Lineamientos para determinar los catálogos y publicación de información de interés público, y para la emisión y evaluación de políticas de transparencia proactiva, publicados en el Diario Oficial de la Federación el 15 de abril de 2016;
- El Índice de Datos Abiertos establecido en el Programa para un Gobierno Cercano y Moderno (PGCM) 2013-2018, publicado en el Diario Oficial de la Federación el 30 de agosto de 2013, y
- Acuerdo por el que se aprueba la Norma Técnica para el acceso y publicación de Datos Abiertos de la Información Estadística y Geográfica de Interés Nacional, publicado en el Diario Oficial de la Federación el 4 de diciembre de 2014.
Esta Guía contiene 4 pasos: 1) Planea, 2) Publica, 3) Perfecciona y 4) Promueve, que contienen actividades, responsables y tiempos de implementación específicos para cumplir con las disposiciones establecidas en el Decreto.
La implementación de esta Guía será apoyada con recursos digitales, lineamientos, materiales de capacitación y herramientas tecnológicas que podrán encontrarse en el sitio de internet datos.gob.mx.
II. Pasos, actividades y fechas de cumplimiento para las acciones establecidas en la Guía de Implementación de la Política de Datos Abiertos.
Tabla 1 - Pasos, actividades y fechas de cumplimiento para las acciones establecidas en la Guía de Implementación de la Política de Datos Abiertos.
Actividad | Fechas de cumplimiento | Medios de verificación |
Paso 1 |Planea |
1.1 Formar un grupo de trabajo y designar un Enlace y Administrador de Datos Abiertos | 30 días naturales | Oficio de designación Plantilla en: datos.gob.mx |
1.2 Priorizar los datos de valor | 70 días naturales para la primera iteración, y de manera continua según lo marque el Plan Institucional de Publicación de Datos Abiertos para cada conjunto y recurso de datos | Publicación del Plan Institucional de Publicación de Datos Abiertos en datos.gob.mx Plantilla en: datos.gob.mx |
1.3 Generar, publicar y actualizar el Plan Institucional de Publicación de Datos Abiertos | 90 días naturales para la primera iteración, y de manera continua según lo marque el Plan Institucional de Publicación de Datos Abiertos para cada conjunto y recurso de datos | Publicación del Plan Institucional de Publicación de Datos Abiertos en datos.gob.mx Plantilla en: datos.gob.mx |
Paso 2 | Publica |
2.1 Convertir los datos a formatos abiertos | De manera continua según lo marque el Plan Institucional de Publicación de Datos Abiertos para cada conjunto y recurso de datos | Publicación del Plan Institucional de Publicación de Datos Abiertos en datos.gob.mx Plantilla en: datos.gob.mx |
2.2 Incrementar la interoperabilidad y usabilidad de los Datos Abiertos | 90 días naturales para la primera iteración, y de manera continua y según sea recomendado por la Unidad en conjunto con la Coordinación | Uso de estándares y convenciones generales de datos reflejados en datos.gob.mx |
2.3 Mejorar la disponibilidad y medios de distribución de los Datos Abiertos | 90 días naturales para la primera iteración, y de manera continua | El estatus del cumplimiento de cada institución a la Política será publicado en datos.gob.mx |
2.4 Documentar de acuerdo al estándar DCAT y publicar el Catálogo Institucional de Datos Abiertos | 90 días naturales para la primera iteración, y de manera continua según lo marque el Plan Institucional de Publicación de Datos Abiertos para cada conjunto y recurso de datos | Verificación de los conjuntos de datos reflejados en datos.gob.mx |
Paso 3 | Perfecciona |
3.1 Asegurar la disponibilidad de las URL utilizadas para publicar los Datos Abiertos | 90 días naturales para la primera iteración, y de manera continua según lo marque el Plan Institucional de Publicación de Datos Abiertos para cada conjunto y recurso de datos | El estatus del cumplimiento de cada institución a la Política, incluidos la disponibilidad de los URL, será publicado en datos.gob.mx |
3.2 Fomentar la calidad de los Datos Abiertos publicados | 90 días naturales para la primera iteración, y posteriormente de manera continua y cuando sea recomendado por la Unidad en conjunto con la Coordinación | Uso de los estándares recomendados en los Datos Abiertos publicados a partir de la publicación de esta Guía. |
3.3 Responder a los reportes ciudadanos de Datos Abiertos realizados mediante datos.gob.mx | De manera continua | Los reportes ciudadanos y respuestas de las Instituciones serán públicos en datos.gob.mx |
3.4 Asegurar el cumplimiento con la Política de Datos Abiertos | De acuerdo a los tiempos específicos marcados por esta Guía y posteriormente de manera semestral | El estatus del cumplimiento de cada institución a la Política será publicado en datos.gob.mx |
Paso 4 | Promueve |
4.1 Asegurar la generación, publicación y uso de Datos Abiertos en las herramientas y aplicativos digitales del gobierno | 90 días naturales para la primera iteración, y de manera continua | Publicación de herramientas y aplicativos digitales que utilizan Datos Abiertos en datos.gob.mx |
4.2 Impulsar el uso de Datos Abiertos en la ciudadanía | De manera continua | Publicación de acciones de impulso del uso de Datos Abiertos al menos semestralmente |
4.3 Establecer estrategias de comunicación digital | De manera bimestral | Reporte semestral de acciones de comunicación digital publicados en datos.gob.mx |
Paso 1 | Planea
Actividad 1.1 | Formar un grupo de trabajo y designar un Enlace y Administrador de Datos Abiertos.
Tiempo para el cumplimiento | 30 días naturales. |
Áreas Involucradas | Coordinación de Asesores del Titular de la dependencia, homólogas o equivalentes; Dirección General de Tecnologías de Información, homólogas o equivalentes; Unidad Administrativa o Área generadora y/o administradoras de datos; Unidades de Transparencia, homólogas o equivalentes; y OIC. |
Resumen de acciones a realizar | - Designar al Enlace Institucional y Administrador de Datos Abiertos; y, - Sesionar el Grupo de Trabajo Institucional de Datos Abiertos. |
Responsables del cumplimiento con la Política de Datos Abiertos.
El Titular de la Institución designará a dos servidores públicos responsables de dar cumplimiento al Decreto y a esta Guía de Implementación:
- El Enlace institucional, que será el Coordinador de Asesores, el Jefe de la Oficina del Titular de la Institución, o un servidor público con cargo mínimo de Director General que dentro del Reglamento Interno de la Institución tenga como responsabilidad la generación y uso de Datos Abiertos y sea responsable de coordinar las acciones para cumplir con estas disposiciones de acuerdo con la normatividad en la materia.
- El Administrador de Datos, que será el Director General de Tecnologías de la Información u homólogo, y será responsable de coordinar la creación del Plan Institucional de Publicación de Datos Abiertos, implementar los procesos para que los datos se publiquen en el sitio institucional y se vean reflejados en datos.gob.mx, y establecer los mecanismos necesarios para asegurar la disponibilidad de los datos de la Institución publicados en el portal datos.gob.mx
Las designaciones y sus respectivas actualizaciones, deberán ser comunicados de forma oficial a la Unidad, con copia para la Coordinación, conforme a la plantilla que se encuentra en la sección correspondiente del portal de internet datos.gob.mx. En caso de contar ya con la designación de estos responsables, en virtud de las obligaciones plasmadas en la Guía de Implementación de la Política de Datos Abiertos, publicada en el Diario Oficial de la Federación el 18 de junio de 2015, esta actividad no deberá realizarse. Los oficios de designación deberán hacerse públicos en datos.gob.mx.
La Unidad, en colaboración con la Coordinación, podrá hacer recomendaciones sobre las designaciones cuando las Instituciones cuenten con áreas administrativas estratégicas encargadas específicamente de la planeación y administración de datos.
Grupo de Trabajo Institucional de Datos Abiertos.
El Enlace Institucional será encargado de crear y coordinar un Grupo de Trabajo Institucional de Datos Abiertos, que tendrá las funciones de:
- Asegurar el cumplimiento de la Política de Datos Abiertos y la normatividad aplicable en materia de Datos Abiertos al interior de la Institución;
- Asegurar la publicación, actualización, mejoramiento y uso de los Datos Abiertos, así como los recursos requeridos en la Institución para este fin;
- Atender en tiempo y forma las recomendaciones que puedan ser realizadas por la Unidad en colaboración con la Coordinación, mismas que podrán realizarse a través de diversos medios, no siendo necesario hacerlas mediante un oficio, pero sí contando con mecanismos que permitan
comprobar la recepción de las mismas;
- Promover el uso de los estándares de publicación aplicables al proceso de generación y publicación de los Datos Abiertos dentro de la Institución, e
- Impulsar el uso de Datos Abiertos dentro y fuera de la Institución para generar impacto en la población.
El Grupo de Trabajo Institucional de Datos Abiertos estará presidido por:
- El Enlace Institucional, y
- El Administrador de Datos Abiertos.
Además, el Grupo de Trabajo Institucional de Datos Abiertos estará conformado, cuando sea necesario, por:
- El Titular del OIC, responsable de dar seguimiento al cumplimiento de la normatividad vigente en materia de Datos Abiertos;
- El Titular de la Unidad de Transparencia, responsable de velar la normatividad vigente en materia de transparencia, archivos, datos personales o confidenciales, de implementar procesos de protección y resguardo de la información clasificada como reservada o confidencial y solicitar criterios para la protección de datos personales a la autoridad correspondiente cuando sea necesario;
- Cuando sea pertinente, los Titulares de las Áreas Generadoras de datos, responsables de asegurar la calidad, estandarización y actualización de los datos para ser publicados, y
- El Enlace de Comunicación Digital (de conformidad con las Disposiciones Generales para la Implementación, Operación y Funcionamiento de la Ventanilla Única Nacional), responsable de integrar una estrategia de comunicación respecto a la publicación de datos prioritarios y de informar al Grupo de Trabajo Institucional de Datos Abiertos sobre el monitoreo de redes sociales y otros medios.
El Grupo de Trabajo Institucional de Datos Abiertos deberá sesionar como mínimo una vez por semestre o de conformidad con sus planes de trabajo. Las minutas de las sesiones podrán tener un formato libre cuyo requisito mínimo es establecer las circunstancias de tiempo, modo y lugar. A dicha minuta se le deberá adjuntar la lista de asistencia de los servidores públicos que se presentaron a la misma. Las minutas podrán hacerse públicas en datos.gob.mx.
Actividad 1.2 | Priorizar los datos de valor.
Tiempo para el cumplimiento | 70 días naturales para la primera iteración, y de manera continua según lo marque el Plan Institucional de Publicación de Datos Abiertos para cada conjunto y recurso de datos. |
Áreas Involucradas | Enlace Institucional; Unidades o áreas generadoras o administradoras de datos; Unidad de Transparencia, homólogas o equivalentes; Grupo de Trabajo Institucional de Datos Abiertos. |
Resumen de acciones a realizar | - Realizar un inventario de los Sistemas de Información Pública utilizados por la Institución y publicarlos en datos.gob.mx. - Realizar un inventario de los Registros públicos oficiales mantenidos por la Institución y publicarlo en datos.gob.mx. - Priorizar los datos e incluirlos en el Plan Institucional de Publicación de Datos Abiertos. |
La priorización de datos de valor es importante para que los esfuerzos de gobernanza y publicación estén enfocados en la provisión de datos que sean de utilidad, valor y tengan el potencial de crear impacto para la ciudadanía.
Por lo anterior, la priorización de los datos que serán incluidos en el Plan Institucional de Publicación de Datos Abiertos, para su publicación, deberá incluir de manera obligatoria lo siguiente:
1. Los datos solicitados mediante la Infraestructura de Datos Abiertos;
2. Los datos de los registros públicos oficiales generados por la Institución;
3. Los datos públicos generados o administrados por los Sistemas de Información de la Institución, y
4. Los datos públicos utilizados por herramientas digitales, aplicativos web o móviles, desarrollados por la Institución o a nombre de ella.
Los datos resultantes de este ejercicio de priorización, particularmente en lo referente a los numerales 1 a 4, deberán ser incluidos en el Plan Institucional de Publicación de Datos Abiertos, para ser publicados en
datos.gob.mx durante 2017.
Cuando aplique, la priorización también deberá tomar en cuenta:
- Los datos solicitados por la ciudadanía a través de datos.gob.mx;
- Las opiniones de audiencias estratégicas, específicas o de la población en general;
- La información que conforme al ámbito de sus atribuciones contribuya a un propósito de política pública específico o bien, las mejores prácticas a nivel nacional e internacional en la materia, y
- Aquéllos solicitados directamente por la Unidad en colaboración con la Coordinación, así como la información, que de conformidad con la normatividad aplicable, también deba ser considerada.
Actividad 1.3 | Generar, publicar y actualizar el Plan Institucional de Publicación de Datos Abiertos.
Tiempo para el cumplimiento | 90 días naturales para la primera iteración, y de manera continua según lo marque el Plan Institucional de Publicación de Datos Abiertos para cada conjunto y recurso de datos. |
Áreas Involucradas | Enlace Institucional; Grupo de Trabajo Institucional de Datos Abiertos. |
Resumen de acciones a realizar | Generar, publicar y/o actualizar el Plan Institucional de Publicación de Datos Abiertos. |
El Plan Institucional de Publicación de Datos Abiertos es construido de manera permanente y gradual, y es conformado por los conjuntos y recursos de datos proporcionados por las Unidades Administrativas o Áreas responsables de generar y/o administrar datos en las Instituciones.
El Plan Institucional de Publicación de Datos Abiertos tiene como objetivos:
- Conformar un listado público de los datos generados o administrados por la Institución, y
- Señalar al público las fechas para la publicación de los Datos Abiertos.
El Plan Institucional de Publicación de Datos Abiertos deberá ser generado o actualizado de manera constante de acuerdo a la priorización, peticiones, uso y demanda de Datos Abiertos.
Durante la actividad 2.4, estas acciones se utilizarán para documentar y preparar los datos para su publicación en datos.gob.mx.
Además, deberá ser utilizado por los OIC para verificar la publicación y actualización de los Datos Abiertos en datos.gob.mx
Eliminación o cambios significativos de los Datos Abiertos
Los Datos Abiertos son activos que tienen el objetivo de ser usados, reutilizados y redistribuidos por cualquier persona.
La eliminación de la publicación de algún recurso de datos deberá ser aprobado por el Grupo de Trabajo Institucional de Datos Abiertos y, de proceder, se deberá hacer pública la razón y fundamento en la descripción del recurso.
La modificación o eliminación de un conjunto o recurso de datos en el Plan Institucional de Publicación de Datos Abiertos no significará su eliminación de datos.gob.mx, siguiendo el principio de âPermanencia' establecido en el Artículo QUINTO, fracción VIII, del Decreto.
Paso 2 | Publica
Actividad 2.1 | Convertir los datos a formatos abiertos.
Tiempo para el cumplimiento | De manera continua según lo marque el Plan Institucional de Publicación de Datos Abiertos para cada conjunto y recurso de datos. |
Áreas Involucradas | Administrador de Datos Abiertos; Unidades Administrativas o áreas generadoras y/o administradoras de datos. |
Resumen de acciones a realizar | - Exportar los datos a archivos en formato abierto; - Identificar si se requiere estructurar formatos adicionales que faciliten su lectura y uso de acuerdo al tipo de dato, y - Asegurar la validez del formato y estructura del archivo. |
Publicar datos en formatos abiertos asegura que los datos estén disponibles para ser utilizados por computadoras y personas.
Formatos abiertos
Formatos de archivo para los cuales su especificación se encuentra disponible abiertamente y, por lo cual, no se requiere de licencias o software especializado para su interpretación.
Existen diversos tipos de formatos para publicar Datos Abiertos (Anexo I).
Por lo anterior, se recomienda seguir los siguientes formatos de publicación:
- Datos tabulares, se recomienda el formato CSV, en los cuales los valores o cadenas de caracteres que conforman los datos, se acomodan en filas -separadas por saltos de línea- y columnas -separadas por comas-;
- Datos estructurados, se recomienda el uso de los formatos JSON o XML cuya especificación se encuentra disponible abiertamente;
- Datos espaciales, se recomienda el uso de los formatos SHP, GeoJSON, o KML;
- Documentos de texto, se recomienda el uso del formato ODT. Dicho formato forma parte del estándar ODF (del inglés, Open Document File Format), y
- Finalmente, se podrán publicar datos en formatos abiertos de base de datos contenidos en un solo archivo, como es el caso de los archivos de base de datos SQLite. Adicionalmente, se podrán publicar datos que contengan en un solo archivo las sentencias necesarias en sintaxis del lenguaje SQL para que los mismos puedan ser importados en una base de datos que soporte el estándar de SQL.
Además, se podrán publicar formatos adicionales para cada conjunto para asegurar la mayor inclusión y entendimiento posible, por ejemplo: en el caso de datos tabulares hacer disponible la versión XLS o XLSX del archivo junto con el CSV.
Actividad 2.2 | Incrementar la interoperabilidad y usabilidad de los Datos Abiertos.
Tiempo para el cumplimiento | 90 días naturales para la primera iteración, y de manera continua y según sea recomendado por la Unidad en conjunto con la Coordinación. |
Áreas Involucradas | Administrador de Datos Abiertos; Unidades Administrativas o áreas generadoras y/o administradoras de datos. |
Resumen de acciones a realizar | - Utilizar el Marco Geoestadístico Nacional para todos los nuevos Recursos de Datos publicados que contengan referencias geográficas; - Utilizar el formato UTF-8 para la codificación de los textos en todos los nuevos Recursos de Datos publicados; - Utilizar el estándar ISO 8601 para todos los nuevos Recursos de Datos publicados que contengan referencias temporales; - Utilizar el estándar para la generación y publicación de boletines y notificaciones técnicas como Datos Abiertos; - Cuando sea necesario, utilizar el estándar para fomentar el uso y visualización de datos en datos.gob.mx, y - Adecuar los procesos de generación o administración de datos para orientar la generación de Recursos de Datos de conformidad con estándares y convenciones generales. |
A fin de que los datos sean más útiles, éstos deben ser fáciles de encontrar y comparar dentro y entre sectores, a través de localizaciones geográficas y del tiempo.
Por lo anterior, se deben emprender acciones para mejorar:
- La interoperabilidad de los datos publicados mediante su estandarización, y
- La usabilidad de los datos, mejorando la legibilidad y lógica de publicación de los conjuntos y recursos de datos.
Interoperabilidad de Datos Abiertos.
Para incrementar la interoperabilidad de los Datos Abiertos, las áreas generadoras o administradoras de Datos deberán utilizar de manera obligatoria:
- El Catálogo Único de Claves de Áreas Geoestadísticas Estatales, Municipales y Localidades para el registro de información geográfica (Anexo II);
- El estándar ISO-8601 para el registro de fechas, horas y periodos;
- Codificación de texto en formato UTF-8;
- El estándar ASCII6;
- Los estándares en materia de datos para contrataciones abiertas impulsados por el Gobierno de la República;
- El estándar para la generación y publicación de boletines y notificaciones técnicas como Datos Abiertos (ver manuales en línea en datos.gob.mx/guía) impulsados por el Gobierno de la República, y
- Los lineamientos para fomentar el uso y visualización de datos en datos.gob.mx (ver Anexo V - Recursos en línea) establecidos por la Unidad, en colaboración con la Coordinación.
- La Guía de Datos Abiertos Anticorrupción de la Carta Internacional de Datos Abiertos.
Usabilidad
Para incrementar la usabilidad de los Datos Abiertos, las Instituciones deberán:
- Promover la legibilidad por máquinas: Hacer disponible la información en un formato digital y que ésta se encuentre en un formato de archivo cuya estructura sea adecuada para su procesamiento por computadora. En la medida de lo posible, se deberán utilizar formatos de archivo como JSON y XML. Para lo anterior se recomienda:
â Eliminar cálculos adicionales en formatos tabulares, por ejemplo: una celda "Total" con la suma de una de las columnas;
â Remover imágenes, celdas unidas y cualquier otra edición de forma de los archivos; para facilitar su
procesamiento, éstos deben ser planos, y
â Los campos numéricos, incluyendo los monetarios y magnitudes, deben permanecer en un formato numérico de tipo entero o flotante, es decir, evitar agregar símbolos monetarios o de unidades de medición, p. ej. "200 m2" o " £20", haciendo explícitas las unidades en el nombre de la columna, o en una segunda columna. Por ejemplo "Monto en MXN", "Distancia en KM".
- Promover la legibilidad por humanos: Se podrán publicar los datos en diversos formatos que, además de permitir la legibilidad por máquina, permitan a un usuario comprender los Datos Abiertos. Para lo anterior se recomienda:
â Acompañar formatos abiertos por archivos XLS, a manera de que usuarios de diferentes niveles de conocimiento técnico puedan usarlo;
â Describir claramente los nombres de columnas, por ejemplo "Fecha de solicitud" en lugar de "fech_sol". En caso de mantener dicha codificación, se deberá acompañar el conjunto de datos con un diccionario de datos. Ver actividad 2.4;
â Evitar tener valores de diferentes tipos (como texto y número) para una columna en diferentes registros o filas.
â Evitar información duplicada;
â Eliminar redundancia en datos;
â Asegurar la representación de variables (unificar datos);
â Evitar el uso de rangos numéricos y optar por rangos definidos en el ISO 8601, p. ej. en lugar de 0-5, 6-10, usar quinquenios, y
â Evitar errores sintácticos.
- Establecer categorizaciones de datos: Utilizar categorías bien definidas facilita la consulta y el análisis de datos masivos. Las categorías permiten agrupar datos conforme a una cierta característica o propiedad en común. El establecimiento de categorías en los datos se podrá realizar utilizando atributos de los datos para los cuales es posible establecer valores predefinidos.
- Atender cualquier recomendación de estándares realizada por la Unidad en colaboración con la Coordinación.
Actividad 2.3 | Mejorar la disponibilidad y medios de distribución de los Datos Abiertos.
Tiempo para el cumplimiento | 90 días naturales para la primera iteración, y de manera continua. |
Áreas Involucradas | Administrador de Datos Abiertos. |
Resumen de acciones a realizar | - Publicar los recursos de Datos Abiertos privilegiando el uso de servicios web y APIs, en los términos establecidos en el esquema de interoperabilidad y de datos abiertos (EIDA), y - Asegurar la disponibilidad de las URL para descarga de los Recursos de Datos. |
Los conjuntos de datos deben estar disponibles para descarga directa en un URL único, asegurando su disponibilidad continua y evitando cualquier barrera de acceso, como el uso de contraseñas o interfaces de usuario.
Es responsabilidad del Administrador de Datos Abiertos, mantenerlos accesibles de forma permanente e ininterrumpida. De conformidad con la actividad 3.1, la UGD, en conjunto con la Coordinación, podrá analizar la disponibilidad de las ligas y hacer público el resultado en datos.gob.mx.
Para lo anterior, las Instituciones deberán utilizar los siguientes medios de distribución para los Datos Abiertos:
- Servicios Web: para el establecimiento de comunicaciones de máquina a máquina, a través del intercambio de formatos estructurados y legibles por máquinas como XML o JSON;
- Archivos: para publicar datos o información estática. Se pueden emplear tanto los formatos de publicación (Anexo I) así como en formatos alternos para distribuir datos desde almacenamiento en línea, y
- Alimentadores de noticias (Web feed): para proporcionar contenido de frecuente actualización. Es
particularmente útil para proporcionar notificaciones, noticias, boletines o comunicados que por su naturaleza se actualizan con frecuencia y no resulta conveniente exportarlos a archivos estáticos en formatos de publicación.
La Unidad, en colaboración con la Coordinación, podrá emitir recomendaciones sobre el método de publicación para ciertos datos, mismas que deberán ser seguidas obligatoriamente por las Instituciones.
Actividad 2.4 | Documentar de acuerdo al estándar DCAT y publicar el Catálogo Institucional de Datos Abiertos.
Tiempo para el cumplimiento | 90 días naturales para la primera iteración, y de manera continua según lo marque el Plan Institucional de Publicación de Datos Abiertos para cada conjunto y recurso de datos. |
Áreas Involucradas | Administrador de Datos Abiertos. |
Resumen de acciones a realizar | - Seguir la Guía para documentar metadatos en la Plataforma ADELA para administrar la publicación de Datos Abiertos; - Acompañar los conjuntos de datos de los diccionarios de datos correspondientes, y - Publicar Datos Abiertos de acuerdo a la periodicidad establecida en el Plan Institucional de Publicación de Datos Abiertos. |
Documentación.
Asegurar que los conjuntos de Datos Abiertos incluyen metadatos consistentes y en formatos legibles para humanos y máquinas facilita el entendimiento del origen, tratamiento y significado de los conjuntos y recursos de datos.
Por lo anterior, los metadatos que se publican en el sitio de internet de datos.gob.mx siguen una estructura basada en el estándar DCAT, un estándar de metadatos que tiene el objetivo de mejorar la interoperabilidad de catálogos de datos en la red, con adiciones para incrementar la utilidad de los datos para los usuarios.
A continuación, se muestran los metadatos solicitados, su descripción y en qué sección de la Plataforma ADELA pueden ser generados.
Tabla 2. Metadatos solicitados (los metadatos marcados con * son obligatorios).
ds:identifier* | Identificador único del conjunto de datos, utilizado para agrupar recursos dentro de éste, por ejemplo "rezago-social", "unidades_medicas", "adquisiciones". Utilizar caracteres ASCII (p. ej. sin acentos). |
ds:title* | Título descriptivo del conjunto de datos, por ejemplo "Programa de fomento a la agricultura", "Vuelos comerciales". |
ds:description* | Una explicación de los datos, con suficiente detalle para que los usuarios puedan entender si es de su interés, por ejemplo "Apoyos otorgados a través del programa Opciones Productivas, desglosado a nivel localidad". |
ds:keyword | Lista de términos clave separados por coma, que facilitarán al usuario la búsqueda del conjunto de datos. Es importante considerar el uso de términos no técnicos, por ejemplo "salud, medicinas, compras, agricultura". |
ds:modified* | Fecha y hora de la última modificación del conjunto de datos; en formato ISO 8601, por ejemplo "2014-05-27T01:42:05-05:00" |
ds:contactPoint* | Nombre de la persona de contacto que atenderá dudas y comentarios sobre el conjunto de datos. |
ds:mbox* | Correo electrónico de contacto para atender dudas y comentarios sobre el conjunto de datos. |
ds:temporal | La fecha o fechas que cubren los datos, por ejemplo "2013", "2010/2012", "2014-01/2014-04". Si es un rango de fechas, deberán ordenarse ascendentemente. |
ds:spatial | El espacio geográfico que cubre el conjunto de datos. Puede ser una región, el nombre de un lugar, una clave INEGI, un polígono o un cuadro delimitador de coordenadas geográficas (bounding box) en GML. Por ejemplo "Baja California", 002, http://www.geonames.org/4017700/baja-california.html, "estatal", o "32.71,-112.32 27.99, -118.45". |
ds:landingPage* | Dirección electrónica para obtener mayor documentación o información sobre el conjunto de datos, como lo puede ser un manual, un sitio web, o un diccionario de datos. Este documento sirve como guía adicional para que el usuario entienda con mayor detalle los datos. |
ds:accrualPeriodicity* | Frecuencia con la cual el conjunto de datos será publicado o actualizado, por ejemplo "mensualmente". |
ds:quality | Información adicional sobre la calidad y procesos de control de calidad de los conjuntos de datos de los procesos de control de calidad del conjunto de datos |
Metadatos (descriptores) del recurso o descargable (dcat:Distribution)
ds:identifier* | La clave que identifica al conjunto de datos al que pertenece (y bajo el que se agrupa) este recurso. Ver ds:identifier. |
rs:title* | Título descriptivo del recurso o descargable, por ejemplo "Otorgamientos del 2013", "Otorgamientos del 2014", "Apoyos por municipio", "Apoyos por localidad". |
rs:description | Ver ds:description. Esta explicación es adicional a la que existe en el conjunto de datos. |
rs:downloadURL* | Dirección electrónica (enlace) para la descarga del recurso. |
rs:mediaType* | Formato de archivo del recurso a descargar, por ejemplo "text/csv", "application/rss+xml". Este campo permite al usuario buscar conjuntos de datos por formato en datos.gob.mx. |
rs:byteSize | El tamaño en bytes del recurso o descargable, por ejemplo 3145728. |
rs:temporal | Ver ds:temporal |
rs:spatial | Ver ds:spatial |
rs:codelists | Información y documentación sobre los códigos utilizados en el recurso de datos, por ejemplo Marco Geoestadístico Nacional o ISO 8601. |
re:codelistlink | Hipervínculos a las fuentes oficiales de los códigos y estándares utilizados. |
rs:copyright | En caso de ser necesario, describir los derechos de copyright de los datos o información contenida dentro del recurso de datos, por ejemplo Fotografías de un acervo. |
rs:tools | Especificar las herramientas recomendadas para el uso, visualización o análisis ligadas al recurso de datos. Por ejemplo JsonView, Herramienta de Datos para Cambio Climático. |
Además de los metadatos, es necesario que cada conjunto se acompañe de un diccionario de datos con el objetivo de que los usuarios comprendan el origen, metodologías, significado y potencial de los datos (Anexo III), de ser posible privilegiando su publicación en formato CSV.
Publicación.
La publicación de Datos Abiertos se llevará a cabo a través de la Plataforma ADELA - aplicación web que permite documentar y publicar los Datos en datos.gob.mx.-
Dentro de esta plataforma las Instituciones podrán:
- Publicar los oficios de designación, minutas de trabajo y demás documentos;
- Desarrollar el Plan Institucional de Publicación de Datos Abiertos;
- Documentar los conjuntos y recursos de Datos Abiertos;
- Dar seguimiento a las recomendaciones y acciones pendientes en su Plan Institucional de Publicación de Datos Abiertos, y
- Publicar los Datos Abiertos en datos.gob.mx.
Además, existen otros mecanismos para la carga masiva y automática de datos abiertos (Anexo IV), que podrán ser utilizados siempre y cuando haya previa validación desde portales de Datos Abiertos propios basados en CKAN o DKAN, previa validación de la Unidad en colaboración con la Coordinación. De igual manera, cuando sea el caso, datos.gob.mx podrá cosechar datos públicos en los sitios institucionales de la APF.
Al publicar los datos abiertos en datos.gob.mx, éstos serán asociados inmediatamente con los Términos de Libre Uso MX, con los cuales se da la certidumbre de que cualquier persona puede usar los datos para cualquier fin legal que se proponga, con el único requisito de citar la fuente de origen.
Paso 3 | Perfecciona
Actividad 3.1 | Asegurar la disponibilidad de las URL utilizadas para publicar los Datos Abiertos.
Tiempo para el cumplimiento | 90 días naturales para la primera iteración, y de manera continua según lo marque el Plan Institucional de Publicación de Datos Abiertos para cada conjunto y recurso de datos. |
Áreas Involucradas | Administrador de Datos Abiertos. |
Resumen de acciones a realizar | - Proveer los procedimientos, recursos e infraestructura necesaria para mantener la publicación permanente de los Datos Abiertos de la institución conforme a los lineamientos de esta Guía; - Asegurar la disponibilidad de las URL utilizadas para publicar Datos Abiertos, e implementar acciones para monitorear su disponibilidad, y - De ser el caso, atender las recomendaciones sobre la disponibilidad de las URL. |
El Administrador de Datos Abiertos deberá asegurar la disponibilidad de las URL publicadas en datos.gob.mx, a través de los siguientes lineamientos:
- Fuentes válidas: apuntar las URL a un medio de distribución válido, de acceso directo y legible por máquina, como se describe en la actividad 2.4 de esta Guía. Cualquier otro medio de distribución, particularmente para lectura humana, deberá tratarse como una herramienta de la Institución, conforme a lo establecido en la actividad 4.1;
- Infraestructura adecuada: una infraestructura (ya sea propia o de terceros) suficiente y adecuadamente monitoreada para servir el volumen de transacciones estimadas de los Datos Abiertos; en caso de contar con infraestructura física propia, salvaguardar la integridad, disponibilidad y seguridad de los datos en todo momento, y servir los datos con un caché con tiempo de vida corto;
- Definición de las URL: asegurar que las URL deriven de un nombre de dominio y no de una IP. Las URL deberán conformarse únicamente por caracteres dentro del rango ASCII;
- Actualización de los datos: contar con métodos y procedimientos que mantengan la integridad de los directorios, nombres de los archivos y otros medios de distribución, particularmente al hacer una actualización de los datos, de manera que los vínculos se mantengan activos en el proceso. Es recomendable que los recursos de datos sean generados y actualizados de manera automática, y
- Mantenimiento a la infraestructura: considerar y prever los casos de posible mantenimiento a la infraestructura (propia o de terceros) que pudiera afectar o interrumpir la disponibilidad de los datos de la Institución, así como contar con procedimientos y responsables para restablecimiento inmediato del servicio en caso de fallas imprevistas.
La Unidad, en colaboración con la Coordinación, podrá monitorear y emitir recomendaciones específicas sobre la disponibilidad de las URL de los Datos Abiertos de la Institución y publicar los resultados en datos.gob.mx, con el fin de asegurar la adecuada implementación de estos lineamientos.
Actividad 3.2 | Fomentar la calidad de los Datos Abiertos publicados.
Tiempo para el cumplimiento | 90 días naturales para la primera iteración, y posteriormente de manera continua y cuando sea recomendado por la Unidad en conjunto con la Coordinación. |
Áreas Involucradas | Enlace Institucional; Administrador de Datos Abiertos; áreas generadoras o administradoras de datos; Unidad de Transparencia; Órganos Internos de Control. |
Resumen de acciones a realizar | Atender las recomendaciones generales y actividades pendientes informadas a las Instituciones. |
La Unidad, en colaboración con la Coordinación, podrá hacer recomendaciones a las Instituciones sobre cómo incrementar el cumplimiento de la Política de Datos Abiertos, y la calidad y utilidad de los datos publicados.
Estas recomendaciones podrán realizarse por diversos medios en donde el público en general, el Enlace Institucional, Administrador de Datos Abiertos y los OIC podrán conocer lo siguiente:
- Recomendaciones generales: por ejemplo, cumplimiento con la Política de Datos Abiertos, solicitudes ciudadanas, ligas rotas y calidad de metadatos, entre otros, y
- Actividades pendientes: por ejemplo, la publicación o actualización de datos según el Plan Institucional de Publicación de Datos Abiertos.
Las Instituciones deberán atender todas las recomendaciones y actividades pendientes como sea pertinente.
Actividad 3.3 | Responder a los reportes ciudadanos de Datos Abiertos realizados mediante datos.gob.mx.
Tiempo para el cumplimiento | De manera continua. |
Áreas Involucradas | Enlace Institucional; Administrador de Datos Abiertos; áreas generadoras o administradoras de datos; Órganos Internos de Control. |
Resumen de acciones a realizar | Dar respuesta a las solicitudes ciudadanas de Datos Abiertos obtenidas en un periodo no mayor a 30 treinta días naturales a partir de que sean informados a la institución. |
En datos.gob.mx se podrán incluir mecanismos para informes y reportes ciudadanos de Datos Abiertos, los cuales seguirán el siguiente proceso:
1. Los reportes podrán ser remitidos al correo electrónico de los responsables de cada conjunto de datos y al Administrador de Datos Abiertos;
2. De ser el caso, el Administrador de Datos Abiertos deberá consultar a las Áreas Generadoras, sobre
la disponibilidad de los Datos solicitados y si el reporte procede o no, de acuerdo a la existencia de los datos;
3. De tener una respuesta afirmativa, el Administrador de Datos Abiertos dará respuesta a la solicitud especificando la fecha estimada de publicación de los datos en datos.gob.mx, y
4. De tener respuesta negativa, el Administrador de Datos dará respuesta a la solicitud con el fundamento jurídico que corresponda.
Se deberá responder a los informes o reportes ciudadanos en un periodo de 30 treinta días hábiles a partir de que se informen al Administrador de Datos Abiertos, después del cual el resultado y estatus de la petición podrá ser publicado en datos.gob.mx
Actividad 3.4 | Asegurar el cumplimiento con la Política de Datos Abiertos
Tiempo para el cumplimiento | De acuerdo a los tiempos específicos marcados por esta Guía y posteriormente de manera semestral de acuerdo a las fechas de publicación y actualización establecidas en el Plan Institucional de Publicación de Datos Abiertos |
Áreas Involucradas | OIC |
Resumen de acciones a realizar | Verificar el cumplimiento de las acciones de esta Guía y su implementación. |
Para efectos de la presente Guía, corresponderá a la Secretaría de la Función Pública, a través de los OIC, vigilar su cumplimiento.
La verificación del cumplimiento se hará de acuerdo a los tiempos establecidos en cada paso. De igual manera, será prioritario verificar el cumplimiento de las fechas de publicación y actualización de cada conjunto y recurso de Datos Abiertos según lo establecido por el Plan Institucional de Publicación de Datos Abiertos.
Paso 4 | Promueve
Actividad 4.1 | Asegurar la generación, publicación y uso de Datos Abiertos en las herramientas y aplicativos digitales del gobierno
Tiempo para el cumplimiento | 90 días naturales para la primera iteración, y de manera continua. |
Áreas Involucradas | Administrador de Datos Abiertos; áreas generadoras o administradoras de datos. |
Resumen de acciones a realizar | - Publicar los datos generados o utilizados por las herramientas y aplicativos desarrollados o mantenidos por la Institución o a nombre de ella en datos.gob.mx, e - Incluir una liga visible en todas las herramientas y aplicativos mantenidos por la institución para la descarga de datos en datos.gob.mx. |
Las Instituciones que desarrollen o mantengan herramientas o aplicativos de acceso público deberán, obligatoriamente:
1. Publicar o referenciar todos los datos generados o utilizados por las mismas en datos.gob.mx, de acuerdo a lo establecido en esta Guía;
2. Publicar la herramienta o aplicativo correspondiente en la sección de âHerramientas' de datos.gob.mx
y en la sección de aplicaciones de gob.mx, e
3. Incluir una liga visible en la herramienta o aplicación para la descarga de los datos desde datos.gob.mx.
Las Instituciones deberán observar los puntos anteriores tanto para el desarrollo o migración de sus herramientas, como para su publicación en datos.gob.mx. Asimismo, con el fin de asegurar la adecuada implementación de dichos lineamientos, la Unidad en colaboración con la Coordinación, podrá emitir recomendaciones específicas sobre las herramientas publicadas.
Se consideran como herramientas, las siguientes:
- Sitios técnicos (no incluidos en gob.mx) dentro del dominio de la Institución, que presenten datos estadísticos, gráficas, mapas, imágenes y/o textos;
- Procesadores analíticos comúnmente relacionados con "Business Intelligence" (inteligencia de negocios), incluyendo tableros ("dashboards"), calculadoras y/o modelos numéricos;
- Visores geográficos que utilicen mapas, imágenes geomórficas, satelitales, modelos atmosféricos, superficiales, submarinos o subterráneos, así como cualquier otro tipo de dato espacial o georeferencial;
- Indexadores de datos sobre bancos de información, colecciones de documentos, archivos, digitalizaciones, audio, video o imágenes, y
- Aplicaciones web o móviles que utilizan o procesan datos dinámicos y/o estáticos de referencia, estadísticos o geográficos.
Actividad 4.2 | Impulsar el uso de Datos Abiertos en la ciudadanía.
Tiempo para el cumplimiento | De manera continua. |
Áreas Involucradas | Enlace Institucional; Enlaces de Participación Ciudadana en cada institución |
Resumen de acciones a realizar | Cuando aplique, asegurarse que se llevarán a cabo consultas ciudadanas sobre la priorización, Plan Institucional de Publicación de Datos Abiertos, Catálogo de Datos Abiertos u otras iniciativas de publicación y uso de datos abiertos institucionales en www.gob.mx/participa |
Las Instituciones deberán tener contacto constante con todos los sectores de la sociedad para conocer la opinión directa de los usuarios sobre la prioridad, estructura, calidad y uso de los datos publicados en datos.gob.mx.
Para lo anterior, las Instituciones tienen a su disposición la sección "Participa" en gob.mx/participa, mediante la cual se podrán promover estrategias de consulta y encuestas para promover la creación de impacto mediante la publicación y uso de datos abiertos en colaboración con la ciudadanía.
Además, las Instituciones podrán llevar a cabo datatones y/o hackatones para fomentar mayor participación de la ciudadanía para el desarrollo de aplicaciones, plataformas del sector público, visualizaciones u otras soluciones tecnológicas demandadas por el gobierno.
Las Instituciones que decidan emprender estas acciones deberán asegurarse que la provisión de datos para uso de los ciudadanos en el evento, se haga a través de datos abiertos en datos.gob.mx.
Actividad 4.3 | Establecer estrategias de comunicación digital.
Tiempo para el cumplimiento | De manera bimestral. |
Áreas Involucradas | Enlace Institucional; Enlaces de Comunicación Digital en cada Institución |
Resumen de acciones a realizar | - Informar a los Enlaces de Comunicación Digital sobre la publicación de Datos Abiertos de alto valor; - Usar los mecanismos de comunicación disponibles en la Institución para comunicar datatones y/o uso de Datos Abiertos. |
Las Instituciones deberán contar con una estrategia de comunicación digital, la cual se vuelve indispensable para hacer del conocimiento de la población la disponibilidad de nuevos recursos de Datos Abiertos, en especial, los de alto valor.
En razón de lo anterior, se deberá comunicar a los ciudadanos las acciones para el uso y publicación de datos abiertos mediante sus redes sociales y otros mecanismos de comunicación disponibles. Para esto, se podrán utilizar, entre otros, los siguientes canales:
- Sitios institucionales de internet;
- Redes sociales de la Institución;
- Publicación de historias en datos.gob.mx, y
- Otros que la Institución considere pertinentes.
Las Instituciones deberán realizar estas acciones de comunicación como mínimo bimestralmente, y en cualquier momento cuando sea solicitado por la Unidad, o la Coordinación, así como asegurarse de hacer mención específica a la URL directa de los datos abiertos en cuestión.
Para efectos de la presente Guía, corresponderá a la Secretaría de la Función Pública, a través de los OIC, vigilar su cumplimiento.
La interpretación de las disposiciones vertidas en la presente Guía, así como la resolución de casos no previstos en la misma, para efectos administrativos corresponde a la Unidad, en conjunto con la Coordinación.
III. Glosario.
ASCII: es un código de caracteres basado en el alfabeto latino, comúnmente utilizados por sistemas computacionales para representar un mínimo conjunto de caracteres derivados del inglés moderno. La mayoría de los sistemas informáticos utilizan y entienden este código.
Catálogo de Datos Abiertos: el inventario único de los conjuntos de datos puestos a disposición de la población, en el portal de internet datos.gob.mx, por las dependencias y entidades de la Administración Pública Federal, así como por las empresas productivas del Estado.
Conjunto de Datos: la serie de datos estructurados, vinculados entre sí y agrupados dentro de una misma unidad temática y física, de forma que puedan ser procesados apropiadamente para obtener información.
CSV: el tipo de documento en formato abierto sencillo para representar datos en forma de tabla, en las que las columnas se separan por comas o punto y coma en donde la coma es el separador decimal y las filas por saltos de línea.
Dato: es el registro informativo simbólico, cuantitativo o cualitativo, generado u obtenido por las dependencias y entidades de la Administración Pública Federal, así como por las empresas productivas del Estado.
DCAT: el Vocabulario de Catálogos de Datos es un estándar internacional diseñado para facilitar la interoperabilidad entre los catálogos de datos publicados en la red; para mayor información consultar http://www.w3.org/TR/vocab-dcat/.
Formatos Tabulares: los formatos que presentan los datos en forma de tabla con filas y columnas.
Herramienta: es cualquier instancia de tecnología de información o comunicación que como parte de su funcionalidad permite recabar, consolidar o consultar datos abiertos de una institución.
HTML (Lenguaje de marcas de hipertexto): el lenguaje de marcado para la elaboración de páginas web. Define una estructura básica y un código (denominado código HTML) para la definición de contenido de una página web, como texto, imágenes, entre otros.
Infraestructura de Datos Abiertos: es un listado de datos que guiará la priorización de los Datos Abiertos que serán publicados.
JSON (JavaScript Object Notation): es un formato ligero para el intercambio de datos que parte de un subconjunto de la notación literal de objetos de JavaScript. Dada su simplicidad, su uso se ha generalizado y popularizado en la Web.
Marco Geoestadístico Nacional: sistema nacional diseñado por el INEGI para referenciar correctamente la información estadística de los censos y encuestas con los lugares geográficos correspondientes. Proporciona la ubicación de las localidades, municipios y entidades del país, utilizando coordenadas geográficas. Para mayor información consultar http://www.inegi.org.mx/geo/contenidos/geoestadistica /
default.aspx.
Metadatos: los datos estructurados y actualizados que describen el contexto y las características de contenido, captura, procesamiento, calidad, condición, acceso y distribución de un conjunto de datos, que sirven para facilitar su búsqueda, identificación y uso.
PDF: (portable document format): el formato de almacenamiento de documentos digitales independiente de plataformas de software o hardware.
Plan Institucional de Publicación de Datos Abiertos: es un programa formal de carácter público que debe actualizar anualmente cada una de las Instituciones Obligadas, con las fechas comprometidas de publicación de los Conjuntos de Datos aprobados por el Grupo de Trabajo.
Recurso de Datos: son los archivos descargables en formatos abiertos y accesibles mediante diversos medios de distribución.
TXT: el archivo informático compuesto únicamente por texto sin formato.
URL: es la secuencia de caracteres, de acuerdo a un formato estándar, que se usa para nombrar recursos en internet para su localización o identificación, como por ejemplo documentos textuales, imágenes, páginas Web. La URL del sitio de Datos Abiertos es http://datos.gob.mx.
XLS: la extensión de archivo por defecto del formato propietario de Excel.
XLSX: es la extensión de archivo de Excel, en su versión de formato abierto. Ésta cumple con la característica de seguir el estándar abierto Office Open XML.
XML (lenguaje de marcas extensible): el lenguaje de marcas utilizado para almacenar datos en forma legible. Permite definir la gramática de lenguajes específicos (de la misma manera que HTML) para estructurar documentos grandes. Da soporte a bases de datos, siendo útil cuando varias aplicaciones deben comunicarse entre sí o integrar información.
IV. TRANSITORIOS
PRIMERO.- La presente Guía entrará en vigor al día siguiente de su publicación en el Diario Oficial de la Federación.
SEGUNDO.- A partir de la entrada en vigor de la presente Guía, quedará abrogada la Guía de Implementación de la Política de Datos Abiertos publicada en el Diario Oficial de la Federación el 18 de junio del 2015.
Sufragio Efectivo. No Reelección.
Ciudad de México, a 30 de noviembre de 2017.- La Titular de la Unidad de Gobierno Digital, Yolanda Martínez Mancilla.- Rúbrica.
V. Anexos.
Anexo I - Formatos para la publicación de Datos Abiertos.
Tipo de datos | Formato de archivo | Notas | Ejemplo de datos recomendados para cada formato |
Tabulares | CSV | Es un formato simple y adecuado para datos tabulares, que estructura los datos en filas y columnas separadas por comas. | Población total por cada estado en México. Número total de beneficiarios de un programa social por estado. Número total de accidentes en cada autopista de México. Número total de médicos y enfermeras en cada hospital. |
XLSX | El formato de archivo XLSX está conformado por una estructura XML con una especificación abierta, lo cual permite que sea ampliamente soportado por gran variedad de software de hoja de cálculo. |
XLS | Es un formato de archivo binario y de formato propietario que restringe su para SQLite. software propietario. |
DBF | Es un formato de archivo comúnmente utilizado para publicar datos tabulares. |
Estructurados | JSON | Acrónimo de JavaScript Object Notation, es un formato de texto ligero para el intercambio de datos. JSON es un subconjunto de la notación literal de objetos de JavaScript. | Número total de escuelas primarias y secundarias en cada municipio. Producción de petróleo y gas por entidad. Valor de las exportaciones de crudo por cada destino geográfico. |
XML | Lenguaje de marcado desarrollado por la W3C para almacenar datos en forma legible y estructurada, que propone un estándar para el intercambio de información entre diferentes plataformas. |
RDF | Es un modelo estándar para el intercambio de datos en la Web. Los archivos con esta terminación, generalmente refieren al RDF/XML, que es una implementación del RDF basada en la sintaxis XML. Otra sintaxis común es JSON-LD, que serializa RDF utilizando JSON. |
Datos espaciales (geográficos) | KML | Es un estándar abierto aprobado por la OGC y con notación XML. Comúnmente son agrupados y comprimidos en formato KMZ. | Información geoespacial de los estados de México. Información geoespacial de los municipios de México. Información geoespacial de localidades urbanas y rurales en México. |
WFS | Es una interface estándar aprobada por la OGC para realizar peticiones de entrega datos en notación GML (basada a su vez en XML). |
SHP | El formato ESRI Shapefile (SHP) es un formato de archivo informático propietario de datos espaciales desarrollado por la compañía ESRI, quien crea y comercializa software para Sistemas de Información Geográfica como Arc/Info o ArcGIS. Originalmente se creó para la utilización con su producto ArcView GIS, pero actualmente se ha convertido en formato estándar de facto para el intercambio de información geográfica. |
Texto | ODT | Formato con notación XML, del estándar abierto OpenDocument. | Total de familias beneficiadas por el programa Prospera por localidad. Volumen de las exportaciones de petróleo crudo por país. Información sobre unidades médicas y recursos en salud. Número total de afiliados al sistema nacional de salud federal. |
| DOCX | Ver notas del formato XLSX. | |
| PDF | Este formato contiene los datos de manera desestructurada. | |
Bases de Datos | SQL | Este formato contiene en un solo archivo los datos de una Base de Datos. | Registro Nacional de datos de personas desaparecidas. |
| | | |
Anexo II - Ejemplo de uso del Marco Geoestadístico Nacional.
Datos incorrectamente conformados Fecha de inicio | Estado del trámite | Estado | Municipio | 2010-11-30 | En proceso de entrega de información | Veracruz | Poza Rica | 2014/02/01 | En proceso | Veracruz de Ignacio de la llave | Poza Rica de Hgo. | |
01-10-14 | En espera de pago | Ver. | Poza Rica de Hidalgo | 2014-05 | Desechado por falta de pago | Baja California | Mexicali | 01/01/2015 | Terminado | Baja California | ENSENADA | Ejemplo de datos correctamente conformados En el siguiente ejemplo se estableció una categoría para denotar el estado de un trámite empleando las siguientes categorías: - EP = Espera de Pago - DFP = Desechado por Falta de Pago - T = Terminado Así mismo, se utilizó el Catálogo Único de Claves de Áreas Geoestadísticas Estatales, Municipales y Localidades para establecer los nombres y claves de estados/municipios. En lo que respecta a la información de fechas, se homologaron de acuerdo al estándar ISO-8601. Fecha de inicio | Estado del trámite | Nombre AGEE | Clave AGEE | Nombre AGEM | Clave AGEM | 2010-11-30 | P | Veracruz | 30 | Poza Rica de Hidalgo | 131 | 2014-02-01 | P | Veracruz | 30 | Poza Rica de Hidalgo | 131 | 2014-01-01 | EP | Veracruz | 30 | Poza Rica de Hidalgo | 131 | 2015-05-01 | DFP | Baja California | 02 | Mexicali | 002 | 2016-01-01 | T | Baja California | 02 | Ensenada | 001 | |
Anexo III - Ejemplo de elaboración de un diccionario de datos a partir de datos tabulares.
Datos tabulares relativos a contrataciones públicas.
ID | TÍTULO | DESCRIPCIÓN | ESTATUS | MONTO | DIVISA | FECHA_INICIO | FECHA_FIN |
APF-2013-1 | Servicio de telefonía fija. | Contrato número APF-2013-1 consisten en el servicio de telefonía fija. | Terminado | 10000 | MXN | 2013-11-29 | 2014-12-01 |
APF-2014-3 | Arrendamiento de infraestructura de cómputo. | Contrato número APF-2014-3 para el arrendamiento de infraestructura de cómputo. | Pendiente | 200000 | USD | 2014-01-01 | 2020-12-31 |
Diccionario de datos para los datos relativos a contrataciones públicas.
Campo | Tipo de dato | Descripción |
ID | Alfanumérico | El campo ID permite identificar unívocamente a un contrato. Se conforma de las siglas de la dependencia, el año y un número consecutivo. |
TITULO | Alfanumérico | Título del contrato. Texto corto que identifica al contrato. |
DESCRIPCIÓN | Alfanumérico | Descripción del contrato. Indica cuál es el servicio o producto que se contrata. |
ESTATUS | Alfanumérico | Dato categórico, se admite únicamente el ingreso de alguno de los siguientes valores: Activo, Pendiente, Cancelado o Terminado. |
MONTO | Numérico | Es el monto del contrato. No se admiten separadores de cifras como las comas (,). |
DIVISA | Alfanumérico | Divisa del monto del contrato en formato de 3 letras ISO 4217. |
FECHA_INICIO | Fecha | Fecha de inicio del periodo de vigencia del contrato en el formato ISO 8601. |
FECHA_FINAL | Fecha | Fecha de término del periodo de vigencia del contrato en el formato ISO 8601. |
Anexo IV - Mecanismos de publicación automática de datos en CKAN
CKAN, el catálogo general de datos abiertos en datos.gob.mx permite a las Instituciones que cuenten con portales de datos propios basado en CKAN o DKAN, o con otros sistemas de información, publicar sus datos directamente en datos.gob.mx, completamente documentados, y sin tener que subirlos de manera manual a la Plataforma Adela.
Esto se realiza por medio de un proceso automatizado en donde la Unidad, en conjunto con la Coordinación, deberá activar dicha funcionalidad para las dependencias que así lo deseen.
Los pasos a seguir para activar el proceso son los siguientes:
1. Determinar si la cantidad de datos a publicar o la frecuencia de actualización hacen necesario un método automático de publicación;
2. Contar con un portal propio de datos abiertos expuesto al público y/o contar con capacidades técnicas de generar un archivo .json con el catálogo de datos para el cual se planee iniciar el proceso;
3. Solicitar a la Unidad, en conjunto con la Coordinación el visto bueno para iniciar el proceso - lo cual se podrá hacer vía correo electrónico-;
4. Preparar los datos que serán publicados en datos.gob.mx, de acuerdo a los estándares y esquemas
incluidos en esta guía, y
5. Activar el proceso para que el algoritmo de publicación recorra el portal de datos o archivo .json generado, copiando todos los archivos y colocándolos dentro de la base de datos del portal datos.gob.mx.
Para poder llevar a cabo el proceso de publicación automática se necesita realizar una serie de verificaciones.
1. En caso de contar con un portal basado en CKAN o DKAN, la Institución deberá proveer a la Unidad, en conjunto con la Coordinación, vía correo electrónico, la liga base de su portal de datos (por ejemplo: en datos.gob.mx la liga base del portal de datos es: http://datos.gob.mx/busca), posteriormente se iniciará un proceso interno de carga masiva de los datos del portal, para este paso, la institución no necesita hacer ningún movimiento adicional a menos que los datos no tengan el formato adecuado que se muestra a continuación.
2. En caso de contar con sistemas de información o portales distintos a CKAN o DKAN, se deberá ajustar el catálogo de datos para cumplir con la estructura técnica que permita a datos.gob.mx automatizar el proceso de carga.
Para lo anterior, se deberá seguir el siguiente esquema de metadatos en un formato .json para su carga masiva. Posteriormente un miembro del equipo de la Coordinación procederá a iniciar un proceso interno de carga masiva de los datos del documento entregado, para este paso la dependencia no necesita hacer ningún movimiento adicional a menos que los datos no tengan el formato adecuado que se muestra a continuación:
Nombre | Equivalencia con el estándar DCAT | Nivel | Descripción | Formato | Tipo |
Title | ds:title | Conjunto | Título del conjunto de datos | N/A | Texto |
description | ds:description | Conjunto | Descripción del contenido del conjunto de datos | N/A | Texto |
identifier | ds:identifier | Conjunto | Id del conjunto | N/A | Caracteres |
landingPage | ds:landingPage | Conjunto | URL fuente del conjunto de datos | N/A | URL |
Issued | ds:issued | Conjunto | Fecha de creación | YY-mm-dd | Fecha* |
modified | ds:modified | Conjunto | Fecha de modificación | YY-mm-ddThh:MM* | Fecha* |
language | ds:language | Conjunto | Lenguaje de publicación del conjunto | N/A | Texto |
keyword | ds:keyword | Conjunto | Etiquetas del conjunto | N/A | Lista |
publisher | ds:publisher | Conjunto | Nombre de la institución publicante | N/A | Objeto JSON |
Name | ds:contactPoint | Conjunto | Nombre del responsable de publicar el conjunto | N/A | Texto |
Mbox | ds:mbox | Conjunto | Correo del responsable de publicar el conjunto. | cuenta@dominio.gob.mx | Email |
distribution | N/A | Conjunto | Lista de recursos | N/A | Lista |
byteSize | rs:byteSize | Recurso | Tamaño del archivo en bytes | N/A | Entero |
description | rs:description | Recurso | Descripción del conjunto de datos | N/A | Texto |
format | rs:format | Recurso | Formato digital del archivo (Extensión) | N/A | Texto |
title | rs:title | Recurso | Título del conjunto de datos | N/A | Texto |
Descripción de formato de fecha:
Las fechas dentro del JSON de comunicación deben cumplir con el formato descrito en la Tabla 1. A continuación se explica cada elemento del formato:
- Y: Año
- m: Mes
- d: Día
- T: Separador de fecha y tiempo
- h: Hora
- M: Minutos
Ejemplo de la estructura del archivo .json:
La siguiente estructura json representa una lista de conjuntos. Utilizando la estructura principal explicada en la Tabla anterior. Anidando en una lista los diferentes conjuntos de datos para su consumo por el harvester de datos abiertos de datos.gob.mx.
[ { "title": "Título del conjunto de datos No 1", "description": "Descripción con mayor detalle del
conjunto de datos No 1: incluye los datos de distribución disponibles para este conjunto, un archivo CSV, un
archivo XLS y un API. Incluye algunos caracteres especiales:
\u0398\u03b5\u03c3\u03c3\u03b1\u03bb\u03bf\u03bd\u03af\u03ba\u03b7.", "identifier": "https://
datos.gob.mx/catalog/datasets/1", "issued": "2013-04-26T00:00:00", "modified": "2013-04-
26T00:00:00", "landingPage": "", "publisher": { "name": "Nombre de la institución
publicante", "mbox": "contacto@institución.gob.mx" }, "distribution": [ {
"accessURL": "", "byteSize": "", "description": "Descripción con mayor detalle del formato
de distribución en CSV", "downloadURL": "https://datos.gob.mx/the/actual/catalog/datasets/1/
resources/1.csv", "format": "text/csv", "issued": "2013-04-26T00:00:00",
"license": "https://datos.gob.mx/libreusomx", "modified": "", "title": "Distribución del
conjunto en formato CSV" }, { "accessURL": "", "byteSize": "",
"description": "Descripción con mayor detalle del formato de distribución en PDF", "downloadURL":
"https://datos.gob.mx/the/actual/catalog/datasets/1/resources/2.pdf", "format": "application/pdf",
"issued": "2013-04-26T00:00:00", "license": "https://datos.gob.mx/libreusomx", "modified":
"2013-04-26T00:00:00", "title": "Distribución del conjunto en formato PDF" }, {
"accessURL": "https://data.some.org/the/actual/catalog/link/to/an/api", "byteSize": "",
"description": "A longer description for the distribution", "downloadURL": "", "format": "",
"issued": "2013-04-26T00:00:00", "license": "https://datos.gob.mx/libreusomx", "modified":
"2013-04-26T00:00:00", "title": "Distribución del conjunto en formato API" } ],
"keyword": [ "estadística", "calidad del aire" ], "language": [ "es" ] } ]
Anexo V - Recursos en línea.
1) Formato para inventario de Sistemas de Información
https://docs.google.com/spreadsheets/d/1932jedvoZJDgTptpPesuDJtstarfUoD9wFr4Jcg43js/edit?usp=sharing
2) Formato para inventario de Registros Institucionales
https://docs.google.com/spreadsheets/d/1GQRNxCfOfp66QKeEm_zr5EqcQC7z7JYxqxfvilESQmA/edit?usp=sharing
3) Estándar para la generación y publicación de boletines y notificaciones técnicas como Datos Abiertos - https://docs.google.com/document/d/19QXiESo0oef7V6e40R5ZT5CvD78-H7ghQxWdXjjqo94/edit#heading=h.gjdgxs
4) Términos de Libre Uso MX - https://datos.gob.mx/libreusomx
5) Marco Geoestadístico Nacional - http://www.inegi.org.mx/geo/contenidos/geoestadistica/m_geoestadistico.aspx
6) Norma ISO-8601, especifica la notación estándar utilizada para representar instantes, intervalos e intervalos recurrentes de tiempo evitando ambigedades. Esta notación facilita la migración entre distintas plataformas.
7) Estándar UTF-8 (por su acrónimo en el idioma inglés "8-bit Unicode Transformation Program"), es un formato de codificación de caracteres Unicode e ISO 10646 utilizando símbolos de longitud variable.
Estándar para generar visualizaciones ciudadanas en datos.gob.mx- https://docs.google.com/document/d/1CTUNN0BINb4uqFdD9Wm-YIwUwFOLovWkUZZ13UCbXEI/edit
______________________
En el documento que usted está visualizando puede haber texto, caracteres u objetos que no se muestren correctamente debido a la conversión a formato HTML, por lo que le recomendamos tomar siempre como referencia la imagen digitalizada del DOF o el archivo PDF de la edición.
|