Continuidade de Negócios na FoundryShip Cloud
Esta página resume como a FoundryShip planeja, opera e evolui sua infraestrutura para manter aplicações .NET e Blazor disponíveis mesmo diante de falhas de hardware, incidentes operacionais ou manutenções planejadas.
Fundamentos
1. Princípios de continuidade na FoundryShip
Resiliência de infraestrutura
Redução do impacto de falhas pontuais
A FoundryShip utiliza infraestrutura dedicada, armazenamento NVMe e workloads orquestrados em Kubernetes para reduzir o impacto de falhas isoladas de hardware, reinícios de nós e eventos operacionais comuns. O desenho prioriza realocação rápida de componentes e isolamento entre tenants.
RTO e RPO proporcionais
Recuperação alinhada ao nível de criticidade
Os objetivos de RTO e RPO são definidos conforme o tipo de serviço e o nível de criticidade do workload. Bancos, storage e serviços gerenciados possuem estratégias de recuperação proporcionais ao risco e podem receber tratamento específico em cenários dedicados.
Transparência em incidentes
Comunicação clara durante eventos relevantes
Em incidentes que possam afetar disponibilidade, performance ou integridade de dados, a prioridade é comunicar com clareza o escopo do impacto, as ações de mitigação em andamento e os próximos passos até a normalização.
Recuperação
2. Redundância, backups e recuperação
A estratégia de continuidade da FoundryShip combina redundância operacional, backups periódicos e procedimentos de recuperação documentados para os principais componentes da plataforma.
Aplicações .NET e Blazor
- • Execução em múltiplos pods, quando aplicável ao desenho do serviço.
- • Recriação automática de workloads em caso de falha de nó.
- • Deploys e configurações versionados para facilitar rollback e recuperação.
- • Capacidade de reorquestração rápida dentro do cluster.
Serviços gerenciados
- • PostgreSQL com backups automáticos e rotas de restauração planejadas.
- • Storage compatível com S3 com replicação em múltiplos discos.
- • Cache e mensageria tratados com orientações claras sobre persistência e reprocessamento.
- • Procedimentos de validação periódica dos mecanismos de recuperação.
Para bancos gerenciados, a FoundryShip adota rotinas automáticas de backup com retenção pré-estabelecida e caminhos de restauração definidos de acordo com o tipo de oferta contratada.
Em serviços de cache e mensageria, a continuidade depende também do padrão arquitetural da aplicação. Por isso, orientamos clientes a tratar esses componentes como parte de uma estratégia mais ampla de resiliência, incluindo reprocessamento, filas, retries e idempotência.
Responsabilidade compartilhada
3. Papel do cliente na continuidade de negócios
A continuidade de negócios não depende apenas da infraestrutura. Ela é uma responsabilidade compartilhada entre plataforma e cliente. A FoundryShip cuida da camada de execução, mas cada aplicação também precisa ser planejada para reagir bem a falhas temporárias e cenários degradados.
Boas práticas esperadas da aplicação
- • Uso de retries, circuit breakers e timeouts adequados.
- • Idempotência para operações críticas e reprocessamento seguro.
- • Modo degradado para partes não essenciais do sistema.
- • Separação entre estado persistente e componentes efêmeros.
Governança e processo
- • Backups adicionais sob controle do cliente, quando exigido por compliance.
- • Planos de contingência para operação manual ou degradada.
- • Testes regulares de restauração e retomada em homologação.
- • Definição clara de responsáveis e canais de acionamento em incidentes.
Para workloads realmente críticos, recomendamos que o cliente trate a continuidade como parte da própria arquitetura do produto, e não apenas como um atributo implícito da nuvem.
Isso inclui validar periodicamente o comportamento da aplicação em falhas de banco, indisponibilidade de APIs externas, reinício de pods, expiração de caches e recuperação a partir de backups.
Evolução contínua
4. BETA, maturidade operacional e revisão periódica
Durante a fase BETA e nas etapas seguintes de evolução da plataforma, a FoundryShip revisa continuamente seus processos de operação, limites de recursos, janelas de manutenção e rotas de recuperação.
O objetivo é reduzir o tempo de indisponibilidade percebido pelas aplicações em produção e amadurecer os mecanismos de continuidade à medida que a infraestrutura cresce e novos serviços gerenciados são incorporados.
As práticas descritas nesta página podem evoluir ao longo do tempo. Sempre que houver mudanças relevantes de processo ou capacidade, a documentação oficial será atualizada para refletir o estado mais atual da operação.
Entre para a lista de Founders
Cadastre seu e-mail para receber o link de abertura primeiro e ter prioridade na fila.
Sem cartão nesta etapa — você só decide no lançamento.
Você pode cancelar a qualquer momento. Nenhum pagamento é feito nesta etapa.