---
title: Plano de Trabalho
subtitle: |
  Consultoria Individual de Ciência de Dados e Aprendizado de Máquina no Departamento de Economia e Desenvolvimento em Saúde
lang: pt-br
author:
  - name: Frederico Guth
    corresponding: true
    email: frederico.guth@saude.gov.br
    affiliations:
      - BID
    role: Autor
keywords:
  - Plano de Trabalho
  - Produto 1
  - Cooperação Técnica BR-T1550 (BID/MS)
plain-language-summary: |
  Primeiro produto do Projeto de Consultoria Individual
date: last-modified
bibliography: references.bib
funding: |
  Cooperação Técnica BR-T1550 (BID/MS)
citation:
  container-title: "Consultoria Individual de Ciência de Dados e Aprendizado de Máquina no Departamento de Economia e Desenvolvimento em Saúde"
  type: report
  language: pt-br
  author: Frederico Guth
  editor: Gabriel Squeff
  issued: 2024-02-08
  number: 1
  producer:  "Cooperação Técnica BR-T1550 (BID/MS)"

iadb:
  contract: Cooperação Técnica BR-T1550 (BID/MS)
  project: Consultoria Individual de Ciência de Dados e Aprendizado de Máquina no Departamento de Economia e Desenvolvimento em Saúde
  product: Produto 1
  people: 
      - name: Frederico Guth
        corresponding: true
        email: frederico.guth@saude.gov.br
        affiliations:
          - BID
        role: Autor
      - name: Gabriel Squeff
        email: gabriel.squeff@saude.gov.br
        affiliations:
        - CGES/DESID/MS
        role: Responsável

number-sections: true
jupyter: python3
filters: 
  - quarto
  - nameref
nameref:
  section-number: true
---

## Introdução {#sec-intro}
O presente projeto é uma iniciativa de 12 meses no âmbito da _Cooperação Técnica BR-T1550_ do Ministério da Saúde com o Banco Inter-americano de Desenvolvimento (BID). Seu objetivo maior é fortalecer a capacidade de análise de dados do Departamento de Economia e Desenvolvimento em Saúde (DESID/MS), integrando técnicas avançadas de ciência de dados e preparando a organização para a adoção de modelos de inteligência artificial.

### Motivação


![Sistemas são meios e não fins. (Todas imagens desse relatório são do próprio autor, exceto quando explicitado em contrário.)](images/pratos.svg){.column-margin .lightbox fig-alt="jogador equilibrando pratos e perdendo gols" width=80% #fig-pratos}

A Coordenação-Geral de Informações em Economia da Saúde (CGES/DESID) é uma área multidiprofissional e interdisciplinar responsável por importantes sistemas de registro de informações econômicas de saúde (SIOPS, BPS e ApuraSUS) e pelo uso desses dados para fornecer evidências econômicas para formulação de políticas, diretrizes e metas para a contínua melhoria do Sistema Único de Saúde (SUS).

Desde o início de 2023, a CGES tem investido em melhorias para automatizar e reduzir esforços na obtenção dos registros e aumentar a produção de evidências econômicas baseadas na análise de dados. Tais evidências são a missão principal da DESID e subsidiam a formulação de políticas, diretrizes e metas para que as ações e serviços públicos de saúde sejam  prestados de forma eficiente, equitativa e com qualidade para melhor acesso da população, atendendo aos princípios da universalidade, igualdade e integralidade da atenção à saúde estabelecidos constitucionalmente para o Sistema Único de Saúde (SUS).

A coordenação identificou a necessidade urgente e prioritária de fortalecer suas capacidades de análise de dados, uma vez que conta atualmente com reduzida equipe especializada na área, a maior parte das análises ainda é realizada apenas em planilhas e os processos de ingestão e transformação de dados são _ad-hoc_ e não institucionalizados. 

Essa necessidade se torna ainda mais crítica com a responsabilidade assumida pela CGES na produção futura do Sistema de Contas de Saúde (SHA), em cooperação com a a Organização para a Cooperação e Desenvolvimento Econômico (OCDE) e outras instituições governamentais brasileiras.

Por esses motivo, a CGES está criando o Núcleo de Ciência de Dados da DESID (NCD) que o presente projeto ajudará a organizar.

### Objetivos do Projeto

- Melhorar a qualidade e facilitar os processos de análise de dados da CGES;
- Reduzir a dependência externa da CGES para a realização de suas funções;
- Apoiar a produção do SHA de acordo com a metodologia da OCDE.
- Melhorar os processos de desenvolvimento de produtos de dados.

### Escopo do Projeto

- Análise dos desafios, processos e capacidade técnica atual e desenvolvimento de uma estratégia de utilização de técnicas de Ciência de - Dados e Aprendizado de Máquinas  para melhoria dos processos da CGES.
- Desenvolvimento de plano de infraestrutura técnica e capacitação da equipe.
- Desenvolvimento de metodologia de desenvolvimento de produtos de dados.
- Desenvolvimento de proposta de portfólio de produtos de dados.
- Desenvolvimento de produtos de dados: datasets, esteiras de dados, relatórios, painéis etc.


### Este documento

| | | 
| :----------:|:-------------------|
| **Contrato** | Cooperação Técnica BR-T1550 |
| **Projeto** | Consultoria Individual de Ciência de Dados e Aprendizado de Máquina no Departamento de Economia e Desenvolvimento em Saúde do Ministério da Saúde |
| **Produto** | Entregável 1 - Plano de Trabalho |


## Objetivos
O presente _Plano de Trabalho_ tem como objetivos:

- Contextualizar o Projeto (\nameref{sec-intro})
- Apresentar e justificar a abordagem sociotécnica que será adotada (\nameref{sec-metodo})
- Descrever os entregáveis e o cronograma de entregas (\nameref{sec-result})
- Estabelecer expectativas e critérios de sucesso do Projeto (\nameref{sec-conclusao})

## Método {#sec-metodo}

### Contexto
![A imensidão do confuso mercado de ferramentas analíticas.](images/MAD2023.png){.lightbox fig-alt="Centenas de logotipos de empresas e produtos que oferecem soluções para análise de dados."}

Estima-se que o investimento em ferramentas analíticas tenha superado 80 bilhões de dólares em 2023[@snowflake2020s1]. Muitas organizações já estão na terceira geração de suas _plataformas de dados_, com a esperança de obter _insights_ e tomar decisões rápidas baseadas em evidências. Poucas, porém, podem se dizer verdadeiramente _data-driven_.

::::: {.block fill="yellow.lighten(90%)" outset="1em" radius="6pt" #quadro-plataformas width=70%}

**Datawarehouses e BI (primeira geração):**  consolidando dados de diversas fontes, essa estratégia foca na limpeza e verificação dos dados antes de torná-los disponíveis. Essa centralização enfrenta desafios de escalabilidade à medida que as fontes de dados aumentam. Principais artefatos são relatórios e painéis (_dashboards_). Tabelas e relatórios complicados entendidos por poucos especialistas, impacto limitado nos negócios.

**Big Data e Data Lakes (segunda geração):**  Como resposta aos gargalos da geração anterior e aproveitando a redução de custos de _hardware_, _Data Lakes_ armazenam dados em arquivos, com transformações ocorrendo no momento do consumo. Embora ofereça flexibilidade, esta abordagem apresenta desafios quanto à qualidade e documentação dos dados.

**Plataformas em Nuvem (terceira geração):**  semelhante à geração anterior, mas modernizada com: 

 - **(a)** dados em tempo real (_streams_);
 - **(b)** processamento unificado de dados em _batch_ e _stream_; e 
 - **(c)** uso intensivo da nuvem. Embora aborde falhas anteriores, ainda carrega problemas das gerações passadas.

:::::

![Investimento em capacidade tecnológica, ferramentas e _know-how_ é condição necessária mas não suficiente para se tornar _data-driven_.](images/missing_leg.svg){.column-margin .lightbox #fig-missing-leg width=90%}

Entender por que tantas implantações de plataformas de dados não entregam os resultados esperados é essencial para assegurar o sucesso deste projeto. 

Em nossa experiência, muitos projetos pecam por acreditar que basta investimento em tecnologia.  Investimento em capacidade tecnológica, ferramentas e _know-how_, é condição necessária mas não suficiente para uma organização se tornar _data-driven_ [@fig-missing-leg].

Para compreensão do método a ser adotado no presente projeto, partiremos da definição do problema explorando-o em todas as suas dimensões.

### Definição do Problema

#### Servir, Aprender e Evoluir

![Serviço como fluxo de valor e feedback; um ciclo.](images/servico.svg){.column-margin .lightbox #fig-servico fig-alt="Fluxo de valor da organização para o usuário, serviço, e do usuário para a organização, feedback." width=90% fig-column=margin}

<!-- Todo serviço deve transformar seu _usuário_ para melhor [^usuario]; um _fluxo de valor_ (@fig-servico) que pode envolver diversas etapas e atendimentos [@quadro-transacional-vs-analitico]. -->
Todo serviço deve transformar seu _usuário_ para melhor [^usuario]; um _fluxo de valor_ que pode envolver diversas etapas e atendimentos ([@fig-servico]). O SUS atua diariamente para melhorar a saúde dos brasileiros, milhares de vezes por dia. A importância de _servir_ (atender) está fortemente imbuída na cultura do Ministério.

[^usuario]: *Usuário* Pessoa ou organização que se beneficia de um serviço. Também chamado de _cliente_.

Cada _transação_ [^transacao] deixa um rastro de dados. A imensa quantidade de dados gerados pelo SUS é vista por alguns como um ativo: essa é uma visão equivocada.  Ativos têm valor quando guardados, mas _dados_ só tem valor quando usados. 

::::: {.block fill="yellow.lighten(90%)" outset="1em" radius="6pt" #quadro-plataformas width=70%}
**Dados transacionais:** dados primários que sustentam o funcionamento dos serviços diretos ao usuário e mantêm seu estado atual. Também conhecidos como _dados operacionais_.

**Dados analíticos:** dados derivados das bases transacionais (secundários), fornecem visão agregada e histórica dos serviços.

::::: 

[^transacao]: Uma transação é uma execução do serviço, um atendimento.

![Evolução contínua.](images/evolucao.svg){.column-margin .lightbox fig-alt="Centenas de logotipos de empresas e produtos que oferecem soluções para análise de dados." #fig-evolucao width=50%}

O _feedback_ do usuário, direto e indireto (via indicadores), fornece informações cruciais para aprimorar o serviço: um fluxo de valor no sentido contrário, do usuário para o serviço. O propósito do SUS vai além de atender o usuário no momento presente, mas também envolve a _evolução contínua_ do serviço ([@fig-evolucao],) baseada em evidências. Quanto mais rápido o ciclo de _servir_, _analizar_ e _aprender_, mais hipóteses podem ser testadas e mais rápido o serviço evolui.



#### Desafios Organizacionais {#sec-prisao}

![O "sistema" moendo pessoas. Arte de _Gerald Scarfe_ para o filme _The Wall_ (1982).](images/grinder.png){.column-margin .lightbox fig-alt="Triângulo com propósito, autonomia e maestria em cada vértice." width=90% #fig-grinder}

> "Nos primeiros quatro meses de 2023, mais de 10,3 mil servidores [1/3 do quadro] da Secretaria de Saúde do Distrito Federal (SES-DF) precisaram de atestados de afastamento do trabalho. Grande parte desses servidores são técnicos em enfermagem" -- @Schwingel2023.  

Organizações doentes adoecem pessoas. No serviço público, são servidoras _da ponta_, que tem contato direto com usuário, as que mais adoecem. _O que está acontecendo?_

![Muros organizacionais.](images/paredes3.svg){.column-margin .lightbox fig-alt="times separados tentando sem sucesso coordenar um serviço" width=90% #fig-paredes}

Organizações públicas e privadas ainda são majoritariamente estruturadas em silos funcionais ([@fig-paredes]), com equipes especializadas em áreas como negócio, tecnologia, jurídico, controle; herança da burocracia de Weber e da _gestão científica_ de Taylor do início do século XX.

Esta estrutura exige que cada serviço seja coordenado entre equipes distintas, com diferentes hierarquias, prioridades e linguagens. A dinâmica lembra a brincadeira da _corrida de três pernas_ das _gincanas infantis_, onde se amarra o pé de um criança ao de outra: a falta de alinhamento entre equipes resulta em atrasos e falhas, fazendo com que o conjunto mova-se ao ritmo imposto pela equipe mais lenta.

Os servidores _da ponta_ atendem os _usuários reais_, enfrentam a realidade; os servidores _meio_ atendem os servidores mais à ponta, _usuários internos_. Estar na ponta traz clareza da importância da sua contribuição individual, **senso de propósito**. Ao mesmo tempo, exarceba a **sensação de impotência** diante de uma realidade que não se tem total autonomia para mudar. 

> O servidor na ponta está preso entre a realidade e o muro organizacional.

![Auto-motivação segundo Dan Pink (Figura inspirada em _\@sketchplanations_)](images/danpink3.svg){.column-margin .lightbox fig-alt="Triângulo com propósito, autonomia e maestria em cada vértice." width=90% #fig-danpink}

Dan Pink argumenta que a auto-motivação é impulsionada por três elementos fundamentais: autonomia, maestria e propósito [@pink2010drive]. Autonomia refere-se à capacidade de controlar o próprio trabalho; maestria é o desejo de evoluir continuamente em algo que importa; e propósito diz respeito à conexão do trabalho com algo maior e mais significativo. Pink sugere que quando esses três elementos estão presentes, os indivíduos são mais motivados, engajados e produtivos.

Em certa medida, a organização em silos produz a antítese das condições para a automotivação. 

#### Evolução orientada a missões {#sec-missoes}
A gestão orientada a evidências estabelece apenas o método da resposta, mas não o que perguntar, para onde evoluir. Para isso é primordial definir escolhas estratégicas, decisões políticas.

O conceito de "_missões_" em políticas públicas tem sido popularizado pela economista Mariana Mazzucato[^nib]. Ela destaca a importância de definir objetivos claros, ambiciosos e mensuráveis para orientar a inovação, metas _moonshot_ [@Mazzucato2022].

[^nib]: O Nova Indústria Brasil, proposta do governo para reverter a desindustrialização precoce do país, é inspirada nas ideias de Mazzucato (vide @investnewsNIB e @cartaNIB).

::::: {.block fill="yellow.lighten(90%)" outset="1em" radius="6pt" #quadro-plataformas width=70%}

**Moonshot:** Meta ambiciosa, que requer inovação radical para ser atingida. Remete ao projeto Apollo que ambicionou levar humanos à Lua. Difere-se da missão-maior de servir por ser uma missão-meta, com prazo e escopo definidos.

_Ex._ Meta "Três Bilhões" da OMS: @gpw13

- 1 bilhão de pessoas a mais com cobertura universal de saúde.
- 1 bilhão de pessoas a mais protegidas de emergências de saúde.
- 1 bilhão de pessoas a mais gozando de melhor saúde e bem-estar.

:::::

A ambição de uma meta _moonshot_ envolve essencialmente risco. Elas definem concretamente "_onde_" se quer chegar, mas não "_como_". Para  o "_como_" existem "apostas", caminhos-hipótese que se pode testar. Algumas hipóteses vão falhar, mas o aprendizado é parte do processo.


#### Cultura organizacional {#sec-cultura}

Uma grande contribuição do arcabouço de missões apresentado por Mazzucato é lembrar no debate econômico que mudança é feita por pessoas e que as pessoas são motivadas por propósitos (@fig-danpink).
Para criar um ambiente em que os indivíduos se auto-motivem, é importante criar uma cultura organizacional adequada. Para isso, é importante pensar em governança.

![Governança: Alinhamento e Autonomia.](images/alinha_autonomia.svg){.lightbox fig-alt="gráfico relacionando alinhamento com autonomia" width=70% #fig-governanca fig-align="center"}


Governança é o conjunto de políticas, procedimentos, padrões e responsabilidades estabelecidos para orientar e monitorar a gestão e o uso de recursos (incluindo dados, tecnologia e processos) de maneira eficaz e alinhada com os objetivos da organização. A governança garante que haja clareza nas decisões, responsabilidades e que os riscos sejam gerenciados adequadamente, protegendo os interesses de todas as partes envolvidas.

A relação entre _alinhamento_ e _autonomia_ entre equipes e pessoas determina a governança em uma organização. Quando há pouco alinhamento e pouca autonomia, o resultado tende a ser a uma cultura apática, onde a falta de direção clara e a restrição na tomada de decisão geram desengajamento e falta de iniciativa. Em contraste, um cenário de muito alinhamento com pouca autonomia caracteriza a autocracia, que limita a inovação e a velocidade das mudanças. Por outro lado, pouco alinhamento combinado com muita autonomia pode levar a uma forma de anarquia, onde há esforços descoordenados e ineficiência. 

Muros organizacionais ([@sec-prisao]) favorecem o surgimento de _autocracia_ dentro dos silos e _anarquia_ entre silos. 

O ideal é uma cultura ágil, de muito alinhamento e muita autonomia, que propicia decisões rápidas, bem embasadas e inovadoras. Para tanto, é preciso romper com silos e montar equipes multifuncionais, autônomas e responsáveis por um ou mais serviços do início ao fim e alinhadas à estragégia maior.

![O arcabouço sociotécnico](images/missao.svg){.column-margin .lightbox fig-alt="Triângulo com missão, governança e capacidade." width=90% #fig-missao}


### Abordagem sociotécnica

A análise do problema torna transparente que além de direcionamento estratégico (missão) e capacidade técnica, a evolução contínua de um serviço depende de uma cultura organizacional adequada, ou seja, depende de aspectos sociais. Esse é o argumento central da teoria sociotécnica, cujas lições foram descobertas, esquecidas e redescobertas várias vezes com diferentes nomes ao longo dos anos, das minas de carvão de Yorkshire, ao vale do silício.

#### Das minas de carvão de Yorkshire ao Spotify 
  
  No final dos anos 1940, o carvão era a principal fonte de energia da Inglaterra. Para apoiar a reconstrução industrial pós-guerra, era essencial aumentar a sua produção e reduzir custos. Com esse intuito, introduziram-se novas máquinas nas minas de Yorkshire. A produtividade, contudo, diminuiu.

  Chamados para investigar o problema, pesquisadores do Instituto Tavistock descobriram que as novas máquinas alteraram a dinâmica e cooperação entre os mineiros, que antes trabalhavam em equipes multifuncionais e autônomas com foco na resolução de problemas e alto grau de adaptabilidade.

  Dessa observação nasceu a teoria sociotécnica, que enfatiza a importância de equilibrar tecnologia e relações humanas. Essa lição foi ora esquecida, ora redescoberta em diferentes contextos:

- No esforço de guerra americano que dobrou o PIB em 4 anos;
- Na reconstrução do devastado Japão com o que se tornou conhecido como sistema Toyota de produção (Lean Manufacturing);
- No movimento de Lean Startups e DevOps do Vale do Silício que culminaram no que hoje é referido como modelo Spotify.

| Princípio                            | Descrição                                                                            |
|:-------------------------------------|:-------------------------------------------------------------------------------------|
| **Foco no Valor**              | Focar em entregar valor aos usuários.                                                          |
| **Times Multifuncionais**      | Colaboração entre diferentes especialidades para agilizar e melhorar a qualidade do serviço.   |
| **Autonomia**              | Empoderar equipes para tomar decisões e falhar.                                                |
| **Alinhamento**            | Garantir alinhamento de padrões e objetivos comuns.                                            |
| **Entrega Contínua**       | Automatizar com toque humano, reduzindo o tempo entre pedido e feedback do usuário.            |
| **Feedback Contínuo**      | Utilizar o feedback dos usuários em ciclos rápidos de melhoria.                                |
| **Melhoria Contínua**      | Otimizar constantemente processos e serviços para alcançar excelência operacional.             |
| **Eliminação de Desperdícios** | Eliminar atividades que não agregam valor.                                                   |
| **Comunicação Aberta**     | Promover a transparência e compartilhamento de informações.                                    |
| **Liderança Servil**       | Apoiar, capacitar e servir às equipes, em vez de direcioná-las.                                 |
: Os 10 princípios sociotécnicos


#### DevOps: Abordagem sociotécnica no desenvolvimento de software

No início do milênio, a prestação de serviços via web começou a se sofisticar e _sites_ passaram a ficar cada vez mais parecidos com _aplicações_. 

Em grande medida, a _web_, que foi criada como uma plataforma para publicação e consumo de documentos (páginas), é um ambiente hostil para desenvolvimento de _aplicações. Desenvolver aplicações web requer a coordenação de tarefas variadas e complexas. Incluindo design de interfaces visuais e a experiência do usuário (UI/UX), gestão da compatibilidade entre diferentes navegadores, a garantia de interoperabilidade com bancos de dados e sistemas de terceiros, além de cuidar da manutenção da infraestrutura. 


A entrega de valor acontece quando novas _funcionalidades_ são publicadas e usadas pelos usuários. A evolução do serviço e ganho de competitividade depende de acelerar o ciclo de lançamento, análise e aprendizado. Ainda assim, mesmo entre os líderes de mercado, este era um processo lento, arriscado e custoso e o desenvolvimento de aplicações web envolvia lidar com diversos desafios:

1. **Silos entre Desenvolvimento e Operações**: As equipes de desenvolvimento e operações (negócios) trabalhavam frequentemente em isolamento, com pouca colaboração ou comunicação entre elas. Isso levava a uma transferência ineficaz do software do desenvolvimento para a produção, com operações lutando para gerenciar e manter aplicativos que não compreendiam completamente.

2. **Ciclos de Lançamento Lentos**: Os métodos de desenvolvimento de software tradicionais, como o modelo em cascata, dominavam, levando a ciclos de lançamento longos e inflexíveis. Isso dificultava a capacidade das empresas de responder rapidamente às mudanças no mercado ou às necessidades dos clientes.

3. **Falta de Automação**: A automação em áreas como testes, integração e implantação de software era limitada ou inexistente. Isso resultava em processos manuais propensos a erros, atrasos significativos e uma qualidade de produto inconsistente.

4. **Dificuldades de Escalabilidade e Estabilidade**: Com a popularidade crescente da internet e das aplicações web, as organizações enfrentavam desafios significativos em escalar e manter a estabilidade de seus sistemas sob demanda variável. A falta de práticas e ferramentas adequadas para gerenciar a infraestrutura de TI complicava esses problemas.

5. **Desafios de Qualidade e Confiabilidade**: A falta de práticas contínuas de integração e testes levava frequentemente a bugs de software e problemas de confiabilidade que só eram descobertos após o lançamento. Isso afetava negativamente a experiência do usuário e a reputação das empresas.

6. **Resistência à Mudança**: Existia uma resistência cultural significativa à mudança dentro das organizações. Isso incluía a hesitação em adotar novas tecnologias e práticas, bem como a dificuldade em quebrar os silos organizacionais existentes.


Por volta dos anos 2000, a Amazon implantava melhoria em sua plataforma de e-commerce em ciclos que duravam de muitos meses e até anos. Já em 2015, o varejista implantava mais de 50 milhões de melhorias por ano (uma implantação por segundo) [@HowAmazon]. Em 15 anos a empresa mudou totalmente os seus processos e as inovações criadas no processo deram origem a toda uma nova linha de negócios, a AWS (Amazon Web Services).

O lançamento do _framework_ Rails em 2004 é um marco na trajetória de disseminação de práticas culturais para o desenvolvimento de aplicações web. Surge a ideia de **convenção sobre configuração**, ou seja, a adoção de padrões de processo que tornam possível automatizar tarefas do desenvolvimento.

Já no final dos anos 2000, início dos anos 2010, os aspectos sociotécnicos começaram a ser disseminados e conhecidos como **DevOps** a integração dos silos de desenvolvimento e operações. 

Hoje o desenvolvimento web é muito mais engenharia que arte. Já estão bastante disseminados em toda a indústria processos de:
- controle de versão;
- testes automatizados;
- integração contínua (Continuous Integration, CI);
- implantação contínua (Continuous Deployment, CD).


#### DataOps: Abordagem sociotécnica para Dados
Nos últimos poucos anos, as equipes responsáveis de gestão e análise de dados despertaram para as vantagens da abordagem sociotécnica e começaram a desenvolver e disseminar metodologia ágeis similares ao DevOps. Esse movimento passou a ser chamado **DataOps**.

### Arcabouço Data Mesh

O presente projeto pretende aplicar uma metodologia sociotécnica chamada **Data Mesh**, proposta por Zhamak Dehghani em 2019 e adotada por empresas como Netflix e PayPal. 

Data Mesh propõe uma arquitetura de dados descentralizada, com foco no design orientado ao domínio e autosserviço. Inspirado em teorias de design orientado ao domínio e topologias de equipe, o Data Mesh busca escalar a análise de dados através da descentralização, transferindo a responsabilidade dos dados de equipes especialistas em dados para as equipes de domínio (áreas de negócio), com suporte de uma equipe de plataforma de dados.

Os quatro princípios fundamentais do Data Mesh são:

1. Dados como Produto;
1. Propriedade do Domínio;
1. Plataforma Autosserviço de Dados;
1. Governança Compartilhada.

#### Dados como Produto

Encarar os dados como um produto implica tratá-los com o mesmo nível de cuidado e atenção dedicados ao desenvolvimento de produtos de software. 

Um dado tem valor quando usado e para que seja usado ele precisa ter algumas características identificadas pelo acrônimo _FAIR_:


| Princípio FAIR| Descrição                                        |
|:---------------|:--------------------------------------------------|
| Localizável \(**F**indable)     | Os dados devem ser facilmente descobertos e endereçáveis tanto por humanos quanto por computadores. |              
| Acessível \(**A**ccessible)        | Os dados devem ser nativamente acessíveis e  independentes de sistemas e formatos, permitindo o acesso através de diversas plataformas e  ferramentas.    |
| Interoperável  \(**I**nteroperable) | Os dados devem ser capazes de se integrar com  outros conjuntos de dados, aplicações e  processos de trabalho para análise, armazenamento e processamento. |
| Reutilizável  \(**R**eusable)  | Os dados devem possuir valor intrínseco, ser confiáveis e estruturados de forma que suportem sua reutilização em diferentes contextos.|        


Além dessas características, é importante a _codificação_ de todo o processo de transformação dos dados, o que permite a criação de processos automáticos de documentação, testes e publicação dos dados.

#### Propriedade do Domínio

Este princípio enfatiza a importância de atribuir a autonomia e responsabilidade dos dados às equipes que estão intimamente ligadas ao domínio específico do negócio. A ideia é que as equipes de domínio, que possuem conhecimento especializado sobre seus respectivos setores, estão melhor posicionadas para gerenciar, curar e atualizar os dados de maneira eficaz. Isso promove uma maior qualidade e relevância dos dados, já que a equipe de domínio entende as nuances e requisitos específicos dos dados que gerencia.

No contexto do Projeto, os domínios da CGES são:

- Orçamentos
- Preços
- Custos
- SHA

#### Governança Compartilhada
Este princípio enfatiza a importância de manter padrões e políticas de dados coesos em todos os domínios de uma organização e até entre organizações. 

Além de facilitar a interoperabilidade e automação, a adoção de **convenções** facilita a comunicação entre equipes e reduz a quantidade de decisões de pouca relevância que precisam ser tomadas.

No contexto deste projeto, além de buscar criar políticas de governança compartilhadas entre as coordenações da DESID, buscaremos alinhar nossas políticas a outras áreas como o Departamento de Monitoramento, Avaliação e Disseminação de Informações Estratégicas em Saúde (DEMAS) e às políticas da Infraestrutura Nacional de Dados Abertos (INDA).

#### Infraestrutura de autosserviço
A ideia de uma plataforma de dados autosserviço é fornecer às equipes as ferramentas e capacidades necessárias para acessar, manipular e analisar dados sem depender excessivamente de suporte técnico especializado. Isso democratiza o acesso aos dados e capacita os usuários finais, permitindo que eles realizem tarefas de dados de forma independente, com agilidade e eficiência. Essas plataformas são projetadas para serem intuitivas e fáceis de usar, reduzindo barreiras para o trabalho com dados.

No contexto deste projeto, será desenvolvida uma plataforma autosserviço de análise de dados para o  DESID baseada em ferramentas open-source: DESID Playground.  O **DESID Playground** é um dos principais entregáveis do projeto. 

### Critérios de Sucesso

O conceito de nível de maturidade é aplicado por diferentes governos e organizações para avaliar qualitativamente a eficácia das práticas de gestão e análise de dados e monitorar a evolução desses processos.  À medida que uma organização avança nos níveis de maturidade, ela implementa práticas de governança de dados mais formalizadas e padronizadas, alcançando maior eficiência, qualidade dos dados e capacidade de inovação.


| **Nível** | **Nome**           | **Descrição**                                  |
|:----:|:------------|:------------------------------------------------------|
| 1     | Inicial        | Processos ad-hoc, não estruturados e frequentemente caóticos.|
| 2     | Repetível      | Processos gerenciáveis e repetitivos, mas com pouca formalização.|
| 3     | Definido       | Processos documentados, padronizados e integrados.       |
| 4     | Gerenciado     | Processos monitorados e controlados, com melhoria contínua baseada em métricas.|
| 5     | Otimizado      | Foco na otimização contínua e no uso de dados para inovação e vantagem competitiva.|
: Níveis de Maturidade de Processos de Governança de Dados

Acreditamos que a melhor forma de medir o sucesso deste projeto é através de uma auto-avaliação da equipe beneficiária (CGES/DESID) do nível de maturidade da análise de dados antes e depois do projeto.

A auto-avaliação inicial é um dos entregáveis da próxima etapa do projeto;

### Gestão de Projeto
A gestão do projeto adotará práticas inspiradas na metodologia ágil Scrum, incluindo:

- _sprints_ de 2 a 3 semanas para cada domínio;
- uma reunião de retrospectiva da _sprint_ anterior e planejamento da próxima _sprint_;

<!-- ### Riscos e Mitigações
- falta ferramentas básicas de colaboração e gestão
- datasus -->

## Resultados {#sec-result} 
### Entregáveis

| Entrega | Data | Produto | % Projeto | 
|:------|:-----------|:-------------------------------------------|:-------:|
| 1 | 02-Fev-2024 | ~~Plano de Trabalho~~ | 10% |
| 2 | 04-Mar-2024 | Mapeamento de sistemas e processos de geração de dados | 20% |
| 3 | 01-Abr-2024 |Descrição da Infraestrutura de Desenvolvimento de Produtos de Dados | 20% |
| 4 | 01-Jul-2024 | Mapeamento de potenciais produtos de dados | 20% |
| 5 | 06-Dez-2024 | Apresentação de Produtos de Dados | 30% |



####  Mapeamento de sistemas e processos de geração de dados
 - Auto-avaliação do nível de maturidade 
 - Mapeamento produtos de dados atuais 
 - Mapeamento do gap de capacidades

####  Descrição da Infraestrutura de Desenvolvimento de Produtos de Dados
- Especificação DESID Playground 
- Documentação de processos de desenvolvimento de produtos
- Proposta de plano de capacitação

#### Mapeamento de potenciais produtos de dados
- Proposta de catálogo de produtos

#### Apresentação de Produtos de Dados
- 1 ou mais produtos do domínio Orçamentos (SIOPS) 
- 1 ou mais produtos do domínio Preços (BPS) 
- 1 ou mais produtos do domínio Custos (ApuraSUS) 
- 1 ou mais produtos do domínio Contas de Saúde (SHA) 
- Auto-avaliação do nível de maturidade


### Cronograma

:::::{.column-page-right}
```{mermaid}
gantt
  
  tickInterval 1month
  todayMarker off

  title Projeto de Desenvolvimento de Produtos de Dados
  dateFormat  YYYY-MM-DD
  axisFormat %d-%b
  
  
    section Plano de Trabalho
    Concluído            :p1, 2024-01-07, 2024-02-02

    section Mapeamento de sistemas e processos de geração de dados
    Auto-avaliação do nível de maturidade       : m1, after p1, 1w
    Mapeamento produtos de dados atuais        : m2, after m1, 2w
    Mapeamento do gap de capacidades           : m3, after m2, 2024-03-04

    section Descrição da Infraestrutura de Desenvolvimento de Produtos de Dados
    Documentação de processos                  : d1, after m3, 2w
    Especificação DESID Playground             : d2, after d1 , 2024-04-01 
    Proposta de plano de capacitação           : d3, after d1, 2024-04-01

    section Mapeamento de potenciais produtos de dados
    Documentação processo Desenvolvimento      : c1, after d3, 8w
    Proposta de catálogo de produtos           : c2, after c1 , 2024-07-01
    
    section Apresentação de Produtos de Dados
    Produtos do domínio Orçamentos (SIOPS)     : a1, after c2  , 2024-11-25
    Produtos do domínio Preços (BPS)           : a2, after c2  , 2024-11-25
    Produtos do domínio Custos (ApuraSUS)      : a3, after c2  , 2024-11-25
    Produtos do domínio Contas de Saúde (SHA)  : a4, after c2  , 2024-11-25
    Apresentação :after a4, 2024-12-06
```

:::::

## Conclusão {#sec-conclusao}

Este plano de trabalho representa o primeiro entregável de um projeto ambicioso, cujo objetivo principal é promover a evolução da governança da análise de dados da CGES/DESID. 

Esperamos contribuir para uma evolução nas práticas, processos e ferramentas de análise de dados que represente a elevação de pelo menos um nível de maturidade até o término do projeto. 

A descrição dos entregáveis e o cronograma apresentado reflete a nossa melhor estimativa para a conclusão das etapas planejadas. No entanto, caso identifiquemos oportunidades para adiantar as entregas sem comprometer a qualidade, certamente o faremos. Este compromisso não apenas reflete a nossa dedicação em atingir os objetivos estabelecidos, mas também em superar as expectativas da equipe.

## Bibliografia {.unnumbered}

::: {#refs}
:::




