Infrastruttura e sicurezza
Supporto e monitoraggio
Il monitoraggio serio non è solo “ping verde su Grafana”: è sapere quale metrica conta per il business, chi si sveglia quando rompe e cosa fare nei primi quindici minuti. Il supporto buono non accumula “in attesa del cliente” senza dire cosa è già stato provato. Trattiamo l’operatività come prodotto: coda visibile, priorità concordata con te e retro che cambiano configurazione — non solo chiudono ticket.
Livelli di osservabilità che parlano col prodotto. Latenza API, tasso di errore, code in crescita, disco e connessioni DB — ogni alert con soglia giustificata e destinatario giusto. Evitiamo “non scatta mai” e “scatta ogni notte senza motivo” con la stessa cura: tuning su incidenti reali, non supposizioni.
Cosa possiamo fare per te
Reperibilità in ufficio o 24/7
Scopo e canale (Slack, email, telefono) con SLA di prima risposta.
Dashboard salute ambiente
Una pagina che il CEO capisce: verde, giallo, rosso con contesto.
Alert con runbook di una pagina
Sintomo → check → azione o escalation.
Gestione patch e finestre
CVE critici con piano di applicazione e rollback.
Review mensile costi e performance
Cosa è salito, perché e cosa si può tagliare senza rischio.
Supporto a deploy e release
Qualcuno in finestra concordata con checklist di smoke test.
Integrazione ITSM
Jira, Freshdesk o foglio — storico ticket unico.
Postmortem e backlog migliorie
L’incidente diventa tre azioni con owner e data.
Supporto con contesto e senza scaricabarile. All’apertura del ticket registriamo cosa abbiamo già controllato, ambiente, versione e ipotesi — così il turno successivo non riparte da zero. Se la causa è codice, coinvolgiamo engineering con log e passi di repro; se è infra, agiamo nei limiti del contratto senza nascondere il rischio.
Miglioramento continuo che si vede nel tempo. Dopo incidenti significativi facciamo postmortem snello con azioni assegnate (patch, nuova soglia, documentazione). Se il costo cloud è salito, indichiamo il servizio rumoroso e le opzioni — autoscaling, lifecycle dei log o query pesante. Il CTA è parlarci per allineare reperibilità, finestre di manutenzione e cosa significa P0 vs P2 nel tuo mondo.
Portfolio di Supporto e monitoraggio
Consegne
Accordo di servizio (SLA)
Orari, canali, severità firmati.
Dashboard di monitoraggio
Link e legenda in linguaggio business.
Libreria runbook
PDF o wiki con passi brevi.
Registro incidenti
Storico cercabile con causa radice se nota.
Lista contatti e escalation
Chi chiama chi in ogni turno.
Report periodici
Email o PDF con metriche concordate.
Backlog migliorie tecniche
Voci prioritarie con stima grossolana.
Evidenza patch applicate
Data, pacchetto, ambiente.
Calendario finestre
Manutenzione pianificata visibile al team.
Sessione handoff
In caso di passaggio fornitore o team interno.
Metodologia di esecuzione
-
Onboarding tecnico
Accessi, ambienti, contatti e cosa è critico per il business.
-
SLA e severità
P0–P3 con tempi di prima risposta e risoluzione.
-
Strumentazione minima
Metriche, log e alert concordati.
-
Runbook iniziali
Un pager per servizio critico.
-
Prova di reperibilità
Simuliamo guasto e misuriamo il tempo all’azione.
-
Operazione continua
Code, cambi e comunicazione settimanale o bisettimanale.
-
Gestione del cambio
Finestre, rollback e avviso al prodotto.
-
Revisione alert
Taglio rumore, aggiunta dopo incidente.
-
Report mensile
Incidenti, MTTR, costi, rischi aperti.
-
Retro trimestrale
Cosa cambiare in contratto o architettura.