INFORME

Estándar de resiliencia tecnológica para toda la ciudad

Committee on Information Technology (COIT)

Aprobado el 16 de febrero de 2023.

La Ciudad y el Condado de San Francisco (la Ciudad) se dedican a implementar y operar sistemas y arquitecturas resilientes que apoyen el acceso a servicios críticos para la ciudad, los departamentos y/o el público en caso de desastres naturales o provocados por el hombre.

PROPÓSITO Y ALCANCE

El Estándar de Resistencia Tecnológica para toda la Ciudad es un requisito para el cumplimento conformida de la Política de Preparación, Respuesta, Recuperación y Resistencia ante Desastres (DPR3) de la Ciudad. La Política DPR3 exige que el Director de Información de la Ciudad (CCIO) y el Director de Seguridad de la Información de la Ciudad (CCISO) desarrollen Estándares de Resistencia Tecnológica alcanzables que garanticen la prestación de servicios públicos durante y después de un desastre.

Los requisitos que se detallan en este documento se aplican a todas las plataformas y servicios tecnológicos operados por o para la ciudad. Todos los departamentos, comisiones, funcionarios electos, empleados, contratistas, organizaciones asociadas, licitadores y proveedores que trabajen en nombre de la ciudad están obligados a cumplir con esta política.

Los responsables de TI del departamento, los equipos operativos y tecnológicos, los profesionales de gestión de emergencias/desastres y los enlaces son responsables de implementar los siguientes requisitos.

REQUISITOS DE RESISTENCIA

Los departamentos municipales deben adoptar los siguientes requisitos mínimos de resistencia . Los departamentos deben desarrollar requisitos de resistencia tecnológica equivalentes o superiores a los requisitos establecidos para toda la ciudad.

Sistemas urbanos que requieren planificación de resistencia

El estándar de resistencia se aplica a los siguientes tipos de tecnología:

  • Infraestructura de TI local: Sistemas de software, bases de datos e infraestructura de hardware implementados y alojados en las instalaciones municipales. El personal del Departamentos administra y mantiene las plataformas e infraestructura de TI del departamento. Solo el personal autorizado del Departamentos puede acceder al software y a los datos, cuyo acceso al sistema es local a la red de área local del departamento.
  • Infraestructura de TI de nube híbrida: La nube híbrida se refiere a un entorno mixto de computación, almacenamiento y servicios de software que comprende infraestructura local, servicios de nube privada o nube pública. Una nube híbrida es una combinación de nubes públicas y privadas, que generalmente coordina una única solución de TI entre ambas.
  • Infraestructura de TI en la nube (es decir, Infraestructura como servicio (IaaS), Plataforma como servicio (PaaS)) y Software como servicio (SaaS): la computación en la nube proporciona infraestructura de TI y servicios de Solicitud empresariales a través de Internet. Estos recursos incluyen almacenamiento de datos, servidores, bases de datos, redes y software.
  • Infraestructura tecnológica: Los componentes de la infraestructura tecnológica están formados por elementos interdependientes, como componentes de red, servidores, sistemas operativos y dispositivos.
  • Tecnología Operacional (TO): Hardware o software que detecta o provoca Cambiar mediante la vigilancia; seguimiento; observación; supervisión; monitoreo (por aparatos) y el control directos de equipos, activos, procesos y eventos industriales. La TO es común en los Sistemas de Control Industrial (SCI), como los sistemas de control y adquisición de datos (SCADA) o los sistemas de gestión de edificios.

Análisis y priorización de sistemas

Todos los sistemas tecnológicos empresariales deben ser inventariados, documentándose la información que describe el propósito comercial, la base de usuarios, los datos almacenados o procesados ​​y cualquier requisito reglamentario.

Los departamentos realizarán un Análisis de Impacto; efecto en el Negocio (BIA, por sus siglas en inglés) para cada sistema informático empresarial inventariado, con el fin de comprender el impacto; efecto de un desastre o interrupción en las operaciones comerciales, las dependencias para la recuperación y los objetivos de recuperación. Los BIA completados constituyen un componente del Plan de Continuidad de Operaciones (COOP, por sus siglas en inglés) o del Plan de Recuperación ante Desastres (DRP, por sus siglas en inglés) de TI de cada departamento.

  • La BIA establecerá el Objetivo de Tiempo de Recuperación (RTO) y el Objetivo de Punto de Recuperación (RPO) de cada sistema.
    • El RTO es el tiempo máximo de inactividad tolerable para que un sistema se recupere y vuelva a funcionar con normalidad tras un incidente. Por ejemplo, si una Solicitud crítica de seguridad pública debe recuperarse y estar disponible en 30 minutos antes de que se produzca un impacto; efecto significativo en la seguridad pública , el Departamentos establece un RTO de 30 minutos para ese sistema tecnológico en el BIA.
    • El RPO es la cantidad máxima tolerable de pérdida de datos antes de que se produzca un impacto; efecto inaceptable. Por ejemplo, si no se tolera más de 15 minutos de pérdida de datos transaccionales para una Solicitud crítica de salud pública, el Departamentos establece un RPO de 15 minutos para ese sistema tecnológico empresarial en el BIA.
  • La BIA clasificará cada sistema en niveles del 1 al 4.
    • Nivel 1: El Departamentos no puede operar sin este servicio/tecnología, ni siquiera por un breve período. El impacto; efecto en las operaciones y la posible pérdida de datos son significativamente altos, por ejemplo, la interrupción; perturbación de los sistemas de seguridad pública , las redes de servicios esenciales gestionadas por la ciudad, la infraestructura de radio, las redes de la ciudad y del Departamentos , y las tecnologías/aplicaciones empresariales. Los sistemas de Nivel 1 requieren un RTO de 0 a 4 horas y un RPO inferior a 15 minutos.
    • Nivel 2: El Departamentos puede operar sin este servicio/tecnología durante un breve período. El impacto; efecto en el negocio y la posible pérdida de datos son elevados. Los sistemas de nivel 2 requieren un RTO de entre 4 y 24 horas y un RPO inferior a 1 hora.
    • Nivel 3: El Departamentos puede gestionar la interrupción de este servicio/tecnología durante un período prolongado. Finalmente, es necesario restablecer el servicio/tecnología para evitar impacto; efecto financieras, para el cliente, operativas o legales/regulatorias. Los sistemas de nivel 3 requieren un RTO y un RPO inferiores a 14 días.
    • Nivel 4: El Departamentos puede operar sin este servicio/producto durante un período prolongado, durante el cual el servicio/tecnología contará con soporte mediante métodos alternativos o de respaldo. Los sistemas de nivel 4 requieren un RTO y un RPO inferiores a 30 días.
  • El jefe de Departamentos y el director de informática/TI aprobarán el análisis de impacto empresarial (BIA).

Requisitos de resistencia

Se deben implementar los siguientes requisitos de resistencia para cada nivel del sistema empresarial en todos los tipos de plataformas tecnológicas:

Tier levelResilience StrategyResilience Testing FrequencyResilience Testing Type

Tier 1

High Availability (HA) at the primary site, Active-Active (hot site), and offline backup (e.g., Immutable backup)

For hot site, mirrored systems reside at the secondary/DR site, and most DR failover processes are automated. RTO is 0 to 4 hours and RPO is less than 15 minutes.

Annually

Failover/ Failback or Parallel

Tier 2

High Availability (HA) at the primary site, Active-Prepared (warm site), and offline backup

For warm sites, pre-built DR systems are available for manual activation with active database replication. RTO is between 4 to 24 hours and RPO is less than 1 hour.

Bi-Annually (Once every two years)

Failover/ Failback or Parallel

Tier 3

Active-Passive with active database replication and offline backup

The database is replicated and available for DR, but IT infrastructure will have to be procured and software installed from system backups. RTO and RPO are less than 14 calendar days.

Two - three years after successful test and restore from backup

Test the actual restore procedures from the data backup

Tier 4

Cold Site (offline backups)

For cold sites, no DR systems are available for recovery. The database will be restored from offline backups which are copies of the data set taken at a pre-determined point-in-time. IT infrastructure will need to be procured and installed, and software and configuration will be installed from backups. RTO and RPO are less than 30 calendar days.

Two - three years after successful test and restore from backup

Test the actual restore procedures from the data backup

Requisitos para tecnologías basadas en la nube o alojadas externamente:

Las tecnologías basadas en la nube o alojadas externamente dependen del proveedor para la recuperación ante desastres de las aplicaciones y bases de datos empresariales. Para garantizar la disponibilidad de los servicios municipales, los departamentos colaborarán con su personal de adquisiciones y la Oficina del Comprador para incluir los siguientes requisitos en cualquier solicitud de propuestas (RFP), contratos con proveedores y acuerdos de nivel de servicio para soluciones de nube híbrida, TI en la nube o SaaS, tal como se define en la tabla a continuación.

Tier levelResilience Vendor Reporting

Tier 1

RTO less than 4 hours.

RPO less than 15 minutes.

Vendor to provide Resilience Test Report to the department annually.

If possible, the vendor will invite the department to participate in the vendor Resilience Test to validate Resilience capabilities.

Tier 2

RTO less than 24 hours.

RPO less than 1 hour.

Vendor to provide Resilience Test Report to the department annually.

If possible, the vendor will invite the department to participate in the vendor Resilience Test to validate Resilience capabilities.

Tier 3

RTO and RPO less than 14 days

If possible, the vendor to provide the Resilience Test Report to the department bi-annually.

Tier 4

RTO and RPO less than 30 days

If possible, the vendor to provide the Resilience Test Report to the department bi-annually

FUNCIONES Y RESPONSABILIDADES

La política DPR3, aplicable a toda la ciudad, establece las funciones y responsabilidades de los equipos operativos y tecnológicos, así como de los profesionales de gestión de emergencias y desastres.

Los equipos de Operaciones y Tecnología del Departamentos deberán:

  • Construya e implemente la resistencia siguiendo los requisitos definidos en esta norma.
  • Coordinar con los profesionales de gestión de emergencias/desastres del Departamentos para garantizar que los planes de continuidad operativa/recuperación de la recuperación ante desastres de TI estén actualizados y completos. Realizar pruebas de resistencia según un cronograma regular específico.

Los profesionales del Departamentos de Gestión de Emergencias/Desastres deberán:

  • Apoyar la implementación y el cumplimiento de los requisitos de resistencia de toda la ciudad por parte de un departamento, trabajando con los equipos de tecnología y el liderazgo.
  • Coordinar con la dirección del Departamentos y los equipos operativos o tecnológicos necesarios para actualizar y mantener los planes de recuperación ante desastres/continuidad de TI.
  • Facilitar las pruebas de resistencia tecnológica coordinándose periódicamente con los equipos de tecnología y operaciones.

Departamentos de Tecnología, Oficina de Ciberseguridad - Equipo de Riesgos y Resistencia Tecnológica

  • Proporcionar la orientación; asesoramiento y los recursos necesarios para la implementación, por ejemplo, plantillas de BIA, IT COOP y planes de prueba de recuperación ante desastres, a todos los departamentos de la ciudad.
  • Crear y mantener un sistema centralizado en línea de Riesgos y Resistencia Tecnológica para realizar un seguimiento del progreso de la implementación del Estándar de Resistencia del departamento y respaldar la Revisar/actualización anual del Plan de Continuidad Operativa de TI.
  • Informe a COIT sobre el incumplimiento.

Oficina del Comprador Municipal y Especialistas en Adquisiciones del Departamentos

  • Apoyar la inclusión de requisitos de resistencia durante el proceso de adquisición.

REQUISITOS DE IMPLEMENTACIÓN

  • El Departamentos debe inventariar sus sistemas dentro de los tres meses y realizar un BIA dentro de los seis meses posteriores a la fecha de publicación de esta norma y anualmente a partir de entonces.
  • El Departamentos deberá desarrollar un plan de implementación de resistencia para los sistemas de nivel 1 y nivel 2 dentro de los 12 meses posteriores a la fecha de publicación de esta norma.
  • El Departamentos debe implementar y probar la resistencia para los sistemas de nivel 1 dentro de los 12 meses y para los sistemas de nivel 2 dentro de los 15 meses posteriores a la fecha de publicación de estas normas y anualmente a partir de entonces.
  • Los departamentos deberían considerar la implementación de Resistencia para sistemas de Nivel 3 dentro de los 24 meses posteriores a la fecha de publicación de esta norma y semestralmente después de eso.

EXCEPCIONES

Las excepciones a las normas deberán ser aprobadas caso por caso por la Junta de Revisar de Políticas de COIT.

Los requisitos de resistencia tecnológica a nivel municipal no prevalecerán sobre los requisitos estatales o federal que puedan aplicarse a departamentos municipales específicos.