OVH Community, your new community space.

Riavvii Randomici per Server Dedicati e Chipset probabilmente Troppo Caldi


torpado
13.01.2016, 17.06
Citazione Originariamente Scritto da bago
Certo Torpado, QUANDO viene rilevato il guasto. Come dovresti sapere meglio di tutti noi non tutti i guasti provocano l'accensione di una lampadina "guasto".

Chiaro che se il server non si accende nemmeno allora la strada è semplice, ma se ti si resetta a random perchè la controller dei dischi quando si surriscalda da i numeri, non suggerisco a nessuno di perdere tempo a cercare di convincere OVH di quello che succede, perchè OVH ti fa girare dei test molto basilari (che è praticamente impossibile becchino condizioni di questo genere) e se non rilevano nulla ti dicono "non c'è niente che non va".. Ci sono passato in prima persona... alla fine nei 2-3 giorni che il server rimane inutilizzabile al fine di permettere ad OVH di testarlo io devo comunque mettere in piedi un server nuovo.. e quindi tornando al mio suggerimento: meglio prendere il server nuovo, e restituire quello vecchio (una volta che hai su quello nuovo funzionante perchè dovresti perdere tempo a dimostrare che quello vecchio ha problemi?.
QUANDO:
È di vitale importanza aprire un ticket incidente fornendo i dettagli tecnici rilevati dall'amministratore del server.
Questo è l'unico prerequisito fondamentale per il tecnico che verificherà il problema tramite ticket incidente e per la rapidità di individuazione e risoluzione del problema stesso.

Il team incidenti server dedicati pensa a risolvere il problema il più velocemente possibile.
--
Con questo non metto assolutamente in dubbio che tu possa avere subito dei ritardi in passato nella gestione di un ticket incidente, tutto è migliorabile ed è la strada che seguiamo.

bago
13.01.2016, 16.00
Certo Torpado, QUANDO viene rilevato il guasto. Come dovresti sapere meglio di tutti noi non tutti i guasti provocano l'accensione di una lampadina "guasto".

Chiaro che se il server non si accende nemmeno allora la strada è semplice, ma se ti si resetta a random perchè la controller dei dischi quando si surriscalda da i numeri, non suggerisco a nessuno di perdere tempo a cercare di convincere OVH di quello che succede, perchè OVH ti fa girare dei test molto basilari (che è praticamente impossibile becchino condizioni di questo genere) e se non rilevano nulla ti dicono "non c'è niente che non va".. Ci sono passato in prima persona... alla fine nei 2-3 giorni che il server rimane inutilizzabile al fine di permettere ad OVH di testarlo io devo comunque mettere in piedi un server nuovo.. e quindi tornando al mio suggerimento: meglio prendere il server nuovo, e restituire quello vecchio (una volta che hai su quello nuovo funzionante perchè dovresti perdere tempo a dimostrare che quello vecchio ha problemi?.

torpado
13.01.2016, 12.33
Citazione Originariamente Scritto da bago
Io di solito quando ho un problema con un server di OVH ne ordino un altro e poi restituisco il vecchio (dopo essermi segnato gli id hardware dei componenti, così se me li ritrovo ad un ordine successivo non sto nemmeno a perdere tempo ad installare). Sembra di buttare soldi, ma alla fine si perde molto meno tempo e soldi che cercare di dimostrare cose che difficilmente si possono dimostrare.
Quando un server risulta essere instabile per via di problemi hardware il team incidenti segue, da sempre, la procedura di cambio server:

richiede la sostituzione del server (spare) escludendo il cambio dischi al fine di non avere necessità di reinstallare.

Questa procedura è ovviamente a nostro carico, poichè garantiamo da contratto l'hardware dei server dedicati.

torpado
13.01.2016, 12.29
Citazione Originariamente Scritto da unclezio
Di nuovo un reboot per problemi randomici.

Io posso scrivere anche a supporto ma faccio presente che non ho alcuna intenzione di spendere soldi per fare fare un controllo pagato per farmi sistemare il raffreddamento su un server che è un qualcosa che dovreste garantire voi di base. Dopo due dischi saltati e decine di reboot per problemi di ragione sconosciuta penso proprio che la motherboard su quella macchina sia mezza andata. E questo mi è successo altre volte in passato con altri server da voi.

E' colpa dei componenti ? degli Xeon montati su mobo consumer ? del raffreddamento non efficace ? mah

non ne trovo la causa sinceramente non riesco ad avere una macchina da voi dove far funzionare in maniera tranquilla e stabile esxi
L'hardware dei server è garantito e quando viene rilevato un guasto hardware è nostra competenza sostituirlo, non serve altro.
Non serve ne spendere soldi per richiedere la sosituzione delle parti hardware danneggiate ne comprare un server nuovo.

Hai un numero di ticket supporto da poter verificare e controllare di quale server si tratta? grazie

bago
13.01.2016, 10.49
Io di solito quando ho un problema con un server di OVH ne ordino un altro e poi restituisco il vecchio (dopo essermi segnato gli id hardware dei componenti, così se me li ritrovo ad un ordine successivo non sto nemmeno a perdere tempo ad installare). Sembra di buttare soldi, ma alla fine si perde molto meno tempo e soldi che cercare di dimostrare cose che difficilmente si possono dimostrare.

unclezio
03.01.2016, 13.41
Citazione Originariamente Scritto da Claudia
Ciao!
Contatta il nostro supporto allo 0255600423 o scrivi a supporto@ovh.it, è necessario verificare il sistema di raffreddamento del tuo server in particolare.

È un fenomeno abbastanza raro per noi, perché come probabilmente già sai utilizziamo l'esclusivo sistema di raffreddamento a liquido Watercooling sui nostri server.

Siamo a tua disposizione, fatti sentire!
Di nuovo un reboot per problemi randomici.

Io posso scrivere anche a supporto ma faccio presente che non ho alcuna intenzione di spendere soldi per fare fare un controllo pagato per farmi sistemare il raffreddamento su un server che è un qualcosa che dovreste garantire voi di base. Dopo due dischi saltati e decine di reboot per problemi di ragione sconosciuta penso proprio che la motherboard su quella macchina sia mezza andata. E questo mi è successo altre volte in passato con altri server da voi.

E' colpa dei componenti ? degli Xeon montati su mobo consumer ? del raffreddamento non efficace ? mah

non ne trovo la causa sinceramente non riesco ad avere una macchina da voi dove far funzionare in maniera tranquilla e stabile esxi

pftech
10.10.2015, 07.31
ciao,
escludo un problema generico dato che abbiamo server OVH (no KS) in SBG (come dici tu il DC con container! ) e funzionano egregiamente bene, non si può dire nulla a riguardo.
Anzi devo dire che è qualche anno che (facendo i dovuti scongiuri) non ho più avuto problemi sui server OVH.
Noi usiamo tutti server su Proxmox (tipo ESXI) e ci troviamo molto bene come piattaforma di virtualizzazione.

In ogni caso noi, non per cause di stabilità o prestazioni, ma semplicemente per i vecchi problemi di ban dei server per presunto spam (2 anni fa) e ora per gli aumenti di prezzo mal giustificati, abbiamo migrato la maggior parte dei server altrove... concorrenza diretta OVH, server farm molto più piccole, ottima banda, ottimo supporto tecnico molto reattivo e soprattutto server HP o DELL originali che, con tutto il rispetto per gli "autocostruiti" OVH, per me sono una sicurezza e una garanzia di affidabilità decisamente maggiore!!! (in effetti anche con loro per ora problemi hardware ZERO!).

Ciao,
Paolo

Claudia
06.10.2015, 17.48
Ciao!
Contatta il nostro supporto allo 0255600423 o scrivi a supporto@ovh.it, è necessario verificare il sistema di raffreddamento del tuo server in particolare.

È un fenomeno abbastanza raro per noi, perché come probabilmente già sai utilizziamo l'esclusivo sistema di raffreddamento a liquido Watercooling sui nostri server.

Siamo a tua disposizione, fatti sentire!

unclezio
06.10.2015, 12.28
Salve, sono cliente di ovh da quando ha aperto la sede italiana.

In questi anni ho preso vari server dedicati da voi e ho avuto sempre la sfortuna di incappare in un problema a cui non riuscivo a darmi spiegazione.

Riavvii randomici, anche più di una volta al mese, tutti con cause difficili da individuare e le uniche risposte da parte di ovh parlavano di server con schermata scura e os freezato.

Gli os in questione da me utilizzati sono stati prima debian e poi vmware esxi.

Prima erano dei kimsufi, poi beh sono passato ai dedicati di ovh, devo dire che ancora non ho provato i SYS e ci avrei fatto un pensierino per metterci qualcosa di più piccolo.. chissà..

Comunque sia anche spostandomi su macchine dichiaratamente compatibili con esxi... e anche applicando le ultime patch... riavvi randomici!

Le ho pensate tutte:
- falle di sicurezza da parte dell'os host in grado di permettere ad utenti malevoli di riavviare le macchine
- instabilità sulla rete elettrica.. (ma mi son detto non è possibile perfino i kimsufi più economici hanno tripla alimentazione)
- bug nel sistema di monitoring di ovh che avrebbero potuto portare alla non rilevazione corretta dello stato di up del server imponendo un riavvio non richiesto, ho provato anche con il monitoring disattivo
- ho fatto cambiare anche ram e affini ma nulla

Un idea della quale chiedo conferma invece mi è venuta pensando al sottosistema storage che è saltato in un paio di occasioni anche con dischi danneggiati da sostituire e prendendo in considerazione i momenti in cui ciò è successo.

Voi i server li costruite in casa con componenti presumo di buona fattura, il raffreddamento non lo realizzate a mezzo di ventole ma bensì con waterblock e sistemi a liquido..

dunque:

- i dischi sono adeguatamente raffreddati?
- pur essendo sicuro che le cpu sono ben raffreddate ma si può dire lo stesso di northbridge e southbridge sulle motherboards?

Quest'estate nei giorni di caldo massimo un mio server a SBX il DC fatto coi container per capirci è saltato una continuazione.. ora se fosse un problema dovuto ad altre cause non avrei dovuto avere una vicinanza cosi' netta di eventi.. e il dubbio mi è venuto pensando alle parole di un utente che anche aveva problemi da voi per colpa di un dissipatore mal montato...


La mia prima domanda è: I vostri sistemi a liquido custom coinvolgono anche RAM, ma sopratutto HDD e Chipsets ?

Se così non dovesse essere allora abbiamo un problema perchè non appena c'e' maggiore sfruttamento della parte storage o temperature ambiente superiore alla media i servers fanno su e giù come le montagne russe.

A questo punto meglio i servers Dell e HP preconfezionati ma che tengono botta a problemi di surriscaldamento dei componenti.

La seconda: Dovendo a breve cambiar server.. che posso fare? Buttarmi su modelli con SSD notoriamente più resistenti agli sbalzi termici per sperare di avere maggiore uptime ? Il problema è che sui SYS manca un modello tipo SSD 256GB + 2 x 2 TB di hdd altrimenti l'avrei preso al volo..

Preferirei continuare a stare su ovh anche perchè il buon vecchio hetzy già solo di doverti far prendere il KVM per metter su ESXi sta bene dove sta a mio avviso (dovrebbero metter su le installazioni scriptate anche loro :sisi.

Consigli? Sbaglio qualcosa? Vorrei semplicemente mantenere i miei servers up per un pò + di tempo.. starò collezionando down per un equivalente di 80-88% di uptime altro che 95-98%