OVH Community, your new community space.

Problemi strani con IP failover (da blocco RIPE)


Giampaolo
07.02.2010, 19.21
Citazione Originariamente Scritto da bago
Non ci sono news nel ticket quindi non se se si è sistemato per caso o se si è sistemato in seguito ad un intervento di OVH.
Speriamo la secònda che hai dètto!
Vuoi un consiglio? Se ora funzia tutto chiudi il Ticket alla svelta!!!
Ciao

bago
06.02.2010, 20.22
Questa mattina ho spostato tutti gli IP su un altro server e ancora niente.
Ho migrato l'IP problematico in giro per tutti i miei server e riportato al server "problematico" e ancora niente.

Poi oggi pomeriggio come per magia funzionava ed ora sembra andare bene (tra l'altro funziona anche se lo sposto sulla macchina che ha 200 e passa IP).

Non ci sono news nel ticket quindi non se se si è sistemato per caso o se si è sistemato in seguito ad un intervento di OVH.

bago
05.02.2010, 21.18
Se avete bisogno di fare prove con i miei IP e i miei server fatemelo sapere che vi dico cosa potete fare e cosa no e su quali server potete agire senza interrompere servizi fondamentali.

bago
05.02.2010, 21.17
NIente. Ho spostato anche tutti quelli dal 32 al 128, lasciando quindi pochi IP sul server problematico, ma ancora niente.
Ho spostato l'IP problematico in giro su tutti i miei server e poi riportato lì con l'effetto collaterale che uno dei server è stato disconnesso dalla rete e l'ho dovuto riavviare brutalmente, ma ancora niente.

Il problema è rimasto quello che c'era quando ho aperto il ticket. Ora non ci sono più così tanti IP, spero che riusciate a capire presto cosa c'è che non va.

bago
05.02.2010, 19.12
OK, ho fatto uno script che sposta gli ip da .255 al .128 uno alla volta, con 10 secondi di pausa per essere sicuro che non sovraccaricare i vostri sistemi.
Fra 30 minuti proverò se è cambiato qualcosa.

bago
05.02.2010, 19.04
Citazione Originariamente Scritto da torpado
si il problema è lato Ovh.
Stiamo verificando la possibilità di mantenere "unlimited" il numero di IP associabili ad un server collegato ad uno swtich 100mbs. L'alternativa sarebbe di ridurre gli IP assegnabili in base al tipo di swtich (16 IP su 100mbs switch, 128 IP su 1Gbs switch) al quale il server è collegato.
Io ho la gbit.

Citazione Originariamente Scritto da torpado
1) per far si che torni rapidamente a funzionare devi diminuire, momentaneamente, il numero di IP associati al server
Come ho già scritto ho provato a basculare l'IP verso un server che ha solo 4 IP associati ma a quel punto non era più raggiungibile per nulla.

Comunque ora proverò a spostare 150 IP da quel server ad un altro server e vediamo se cambia qualcosa: stavo aspettando a fare prove per evitare di "sovrappormi" con vostri test.

Citazione Originariamente Scritto da torpado
2) il problema è nello switch e la capacità di memorizzare le corrette ACL, non nel codice di basculamento IP, su questo posso dire che gli admin ci stanno lavorando.
Se posso azzardare una ipotesi a me sembra che il problema sia su 40g.rbx-2-6k.routers.chtix.eu o su 40g.vss-1-6k.routers.chtix.eu e non sullo switch sul quale è attestata la macchina (94.23.XX.254). Ho l'impressione che spostare molti IP su un altro dedicato non mi aiuterà, ma adesso faccio lo script che migra mezza classe C dall'altra parte (se lo faccio a mano ci metto un giorno, altrimenti)

Citazione Originariamente Scritto da torpado
Grazie per la tua collaborazione
Grazie a voi, con questo spirito sono più felice di proseguire questo dialogo.

torpado
05.02.2010, 18.54
Citazione Originariamente Scritto da bago
Quindi diciamo che è assodato che c'è un problema lato OVH.

Le cose da risolvere sono 2:
1) Mettere a posto le ACL in modo che quell'IP ricominci a funzionare
2) Verificare il codice di basculamento OVH che probabilmente ha qualche bug che si verifica in qualche condizione remota (non sono il primo ad avere avuto problemi con gli ip failover a vedere gli altri forum ovh)
si il problema è lato Ovh.
Stiamo verificando la possibilità di mantenere "unlimited" il numero di IP associabili ad un server collegato ad uno swtich 100mbs. L'alternativa sarebbe di ridurre gli IP assegnabili in base al tipo di swtich (16 IP su 100mbs switch, 128 IP su 1Gbs switch) al quale il server è collegato.

1) per far si che torni rapidamente a funzionare devi diminuire, momentaneamente, il numero di IP associati al server
2) il problema è nello switch e la capacità di memorizzare le corrette ACL, non nel codice di basculamento IP, su questo posso dire che gli admin ci stanno lavorando.

Grazie per la tua collaborazione

bago
05.02.2010, 18.22
Citazione Originariamente Scritto da torpado
Si tratta di capire come mai il numero dei basculamenti da te creati sul sistema mac virtuale abbia impedito la corretta scrittura delle ACL sullo switch e non su tutti. Risultato: problema di routing a tratti
Quindi diciamo che è assodato che c'è un problema lato OVH.

Le cose da risolvere sono 2:
1) Mettere a posto le ACL in modo che quell'IP ricominci a funzionare
2) Verificare il codice di basculamento OVH che probabilmente ha qualche bug che si verifica in qualche condizione remota (non sono il primo ad avere avuto problemi con gli ip failover a vedere gli altri forum ovh).

Per quanto capisco che la #2 possa richiedere tempo ed analisi mi piacerebbe capire se avete intenzione (visto che non credo vi manchino le capacità/competenze) di risolvere la #1 a breve così che io possa cominciare ad usare IP e cluster comprati 20 giorni fa.

Vorrei far notare che il mio approccio è di collaborazione più totale tra cliente e fornitore per la risoluzione di un problema, vorrei che evitaste però di darmi risposte come se fosse colpa mia se alcuni router di OVH hanno ACL errate o come se io avessi delle colpe per aver comprato un vostro servizio (Classe C di IP).

Se ho interpretato male le risposte, meglio così: attendo vostre celeri indicazioni su come posso aiutarvi nella risoluzione del problema.

bago
05.02.2010, 16.15
Citazione Originariamente Scritto da torpado
Chi legge i tuoi ticket incidenti sono admin più che preparati, fidati
Allora il problema è che partono dal presupposto che il problema sta dal cliente e non pensano che invece io stia segnalando un bug lato OVH. A volte capita, spero che abbiano capito che invece so di cosa sto scrivendo.

Citazione Originariamente Scritto da torpado
Si tratta di capire come mai il numero dei basculamenti da te creati sul sistema mac virtuale abbia impedito la corretta scrittura delle ACL sullo switch e non su tutti. Risultato: problema di routing a tratti
Guarda, quell'IP l'ho basculato tante volte solo perchè non andava, ma ti assicuro che ha smesso di andare bene la prima volta che l'ho basculato.

Poi comunque ho più di 200 ip failover, penso mi sia concesso bascularne qualcuno? Se ci sono delle limitazioni sarebbe utile conoscerle.

Citazione Originariamente Scritto da torpado
Angie ti ha spiegato che il problema è nel numero di ip associati al server unito al fatto che ci sono delle ACL che non vengono correttamente registrate(IP / mac virtuali) causa frequente cambi di rotte sullo switch utilizzato dal tuo server.
OK, ma quindi dovrebbe essere un vostro problema e non un mio problema, corretto? Quando lo risolvete?

Se è vero che mi permettete di comprare una classe C di IP con un singolo server spero mi sia anche consentito usarli :-)

Citazione Originariamente Scritto da torpado
Ha verificato che il tuo IP pingasse e non ha ricostruito tutto l'iter da te segnalato, che onestamente era lungo ed intricato da seguire.
Evidentemente non ha letto. Ho detto che un determinato mio server non pingava quell'IP e lui ha provato invece con il server che avevo scritto che funzionava. Non so se fate finta o proprio non capite.

Basta che leggi solamente il primo commento del primo ticket e dico in maniera concisa qual è il problema. Poi mi dilungo semplicemente perchè non ottenendo risposte sensate devo portare più materiale a prova delle mie ragioni.

Citazione Originariamente Scritto da torpado
In questo caso, il modo migliore per segnalare un problema è farlo in modo conciso, con pochi dati e nel momento in cui il problema si verifica.
Più che riportare tutti i test e dimostrare che tutti i miei server che sono nello stesso datacenter dove sta l'IP incriminato non riescono a pingarlo mentre quelli che sono in un altro datacenter o fuori da OVH ci riescono non saprei che fare.

Se è vostra intenzione risolvere un vostro bug bene, se invece c'è un limite di IP che non devo associare ad una singola macchina ditemi qual è. Ma vi assicuro che ho già provato a spostare quell'IP su una macchina che ha solo 4 IP associati e non funziona. Anzi, sulla seconda macchina non lo pinga più nemmeno chi prima ci riusciva.

Tutto scritto anche nel ticket.

Quindi, non metto in dubbio che mi abbia risposto una persona preparata, ma non basta una risposta, piuttosto vorrei una soluzione :-)

gio01
05.02.2010, 11.08

Giampaolo
05.02.2010, 10.05
Citazione Originariamente Scritto da gio01
Il cliente a sempre ragione ma qui min pare che non la abbia..
e una questione di educazione
http://it.wikipedia.org/wiki/Verbi_i...italiani#avere
http://it.wikipedia.org/wiki/Accento_%28ortografia%29

gio01
05.02.2010, 09.01
Citazione Originariamente Scritto da Giampaolo
Bene. Mi permetto allora di ricordarti che qui ci sono persone che pagano per avere un servizio, fra le quali il sottoscritto; chiudere le discussioni in faccia ai propri clienti o dare loro risposte superficiali non è, torpado, fare bene il proprio lavoro. Cerca di ricordartelo, ogni volta che entri in ufficio.
Il cliente a sempre ragione ma qui min pare che non la abbia..
e una questione di educazione

Giampaolo
04.02.2010, 23.53
Citazione Originariamente Scritto da torpado
Io sono in Ovh per lavorare
Bene. Mi permetto allora di ricordarti che qui ci sono persone che pagano per avere un servizio, fra le quali il sottoscritto; chiudere le discussioni in faccia ai propri clienti o dare loro risposte superficiali non è, torpado, fare bene il proprio lavoro. Cerca di ricordartelo, ogni volta che entri in ufficio.

torpado
04.02.2010, 22.15
Citazione Originariamente Scritto da bago
Purtroppo l'ho basculato in giro anche su altri 3-4 host ma continua a comportarsi sempre nello stesso modo. Su alcuni host proprio diventa irraggiungibile, su altri è raggiungibile ma non da tutti.

Il problema grosso è come vengono gestiti i ticket. Chi li legge dovrebbe essere in grado di capire il livello di chi ha aperto il ticket, o OVH dovrebbe tenere traccia della qualità dei ticket aperti per stabilire se rispondermi dopo una settimana con una frase di rito o se passare piuttosto il ticket a qualcuno che lo capisce.
Chi legge i tuoi ticket incidenti sono admin più che preparati, fidati

Si tratta di capire come mai il numero dei basculamenti da te creati sul sistema mac virtuale abbia impedito la corretta scrittura delle ACL sullo switch e non su tutti. Risultato: problema di routing a tratti

Angie ti ha spiegato che il problema è nel numero di ip associati al server unito al fatto che ci sono delle ACL che non vengono correttamente registrate(IP / mac virtuali) causa frequente cambi di rotte sullo switch utilizzato dal tuo server.

Ha verificato che il tuo IP pingasse e non ha ricostruito tutto l'iter da te segnalato, che onestamente era lungo ed intricato da seguire.

In questo caso, il modo migliore per segnalare un problema è farlo in modo conciso, con pochi dati e nel momento in cui il problema si verifica.

torpado
04.02.2010, 21.58
Citazione Originariamente Scritto da Giampaolo
Andrea "torpado" Marchetti
a che gioco stai giocando, sempre che farmelo sapere non tradisca le regole del tuo gioco?

Io sono in Ovh per lavorare, per giocare possiamo trovare un'alternativa, più che volentieri

Ma, cerca di ricordarlo ogni volta che premi il tasto di login, NON SU QUESTO FORUM, grazie

Giampaolo
04.02.2010, 19.38
Citazione Originariamente Scritto da bago
Ennesima risposta inconcludente che dimostra che non provano a leggere quello che ho scritto ma partono dal presupposto che io stia sbagliando qualcosa.

Ora mi dicono anche che devo contattare il supporto italiano per farmi spiegare che cosa è il "limite di IP per porta switch". Restando il fatto che non si tratta del problema che sto segnalando perchè quell'IP non va nemmeno se lo rerouto su un dedicato dove c'è solo lui, il supporto italiano può spiegare questo limite del quale non ho trovato traccia in nessuna documentazione/contratto?

Ora hanno aggiunto che nei prossimi giorni cambieranno il contratto dei dedicati per mettere un limite al numero di IP associabili ad una porta, e continuano a dirmi di chiedere al supporto italiano che spiegherò cosa significa questo limite.

Il concetto sarebbe che io voglio usare un IP che ho regolarmente comprato e sto pagando e ancora non ho avuto una risposta su come devo fare. Secondo me OVH ha capito che c'è un problema dal suo lato, ma non capisco perchè non lo ammette e soprattutto perchè non cerca di aiutarmi a sistemare le cose così che io possa cominciare ad usare questi server comprati anzichè stare a fare ipotesi su quale router possa avere una configurazione errata.

Almeno nell'ultimo messaggio si comincia a parlare di ACL dei router... chissà che non siamo nella direzione giusta.
Andrea "torpado" Marchetti ha preso in carico la tua segnalazione, vedrai che ora tutto si sistema, non devi più preoccuparti.

bago
04.02.2010, 19.20
Ennesima risposta inconcludente che dimostra che non provano a leggere quello che ho scritto ma partono dal presupposto che io stia sbagliando qualcosa.

Ora mi dicono anche che devo contattare il supporto italiano per farmi spiegare che cosa è il "limite di IP per porta switch". Restando il fatto che non si tratta del problema che sto segnalando perchè quell'IP non va nemmeno se lo rerouto su un dedicato dove c'è solo lui, il supporto italiano può spiegare questo limite del quale non ho trovato traccia in nessuna documentazione/contratto?

Ora hanno aggiunto che nei prossimi giorni cambieranno il contratto dei dedicati per mettere un limite al numero di IP associabili ad una porta, e continuano a dirmi di chiedere al supporto italiano che spiegherò cosa significa questo limite.

Il concetto sarebbe che io voglio usare un IP che ho regolarmente comprato e sto pagando e ancora non ho avuto una risposta su come devo fare. Secondo me OVH ha capito che c'è un problema dal suo lato, ma non capisco perchè non lo ammette e soprattutto perchè non cerca di aiutarmi a sistemare le cose così che io possa cominciare ad usare questi server comprati anzichè stare a fare ipotesi su quale router possa avere una configurazione errata.

Almeno nell'ultimo messaggio si comincia a parlare di ACL dei router... chissà che non siamo nella direzione giusta.

Giampaolo
04.02.2010, 14.57
Citazione Originariamente Scritto da bago
Dici? All'altro ticket mi aveva risposto Celine, ma a giudicare dal tipo di risposta devono essere amiche e aver avuto lo stesso maestro.
Allora mettiamola così, ti è andata di lusso non sia stato preso in carico da Remi!

bago
04.02.2010, 14.40
Citazione Originariamente Scritto da Giampaolo
Angie? Pensa, sei pure stato fortunato!
Dici? All'altro ticket mi aveva risposto Celine, ma a giudicare dal tipo di risposta devono essere amiche e aver avuto lo stesso maestro.

Giampaolo
04.02.2010, 14.31
Citazione Originariamente Scritto da bago
Mi ha appena risposto una certa Angie dicendo che ho troppi IP associati al mio switch e che comunque l'IP 188.x.x.12 pinga. Non ha capito niente.
Angie? Pensa, sei pure stato fortunato!

bago
04.02.2010, 14.29
Purtroppo l'ho basculato in giro anche su altri 3-4 host ma continua a comportarsi sempre nello stesso modo. Su alcuni host proprio diventa irraggiungibile, su altri è raggiungibile ma non da tutti.

Il problema grosso è come vengono gestiti i ticket. Chi li legge dovrebbe essere in grado di capire il livello di chi ha aperto il ticket, o OVH dovrebbe tenere traccia della qualità dei ticket aperti per stabilire se rispondermi dopo una settimana con una frase di rito o se passare piuttosto il ticket a qualcuno che lo capisce.

camaran
04.02.2010, 14.18
non sei l'unico tempo fa è successo anche a me è bastato basculare da un server ad un altro e ritorno e si è sistemato, boh non so dirti

bago
04.02.2010, 14.05
Mi ha appena risposto una certa Angie dicendo che ho troppi IP associati al mio switch e che comunque l'IP 188.x.x.12 pinga. Non ha capito niente.

Come ho risposto al ticket il numero di IP non è una variabile: se sposto l'IP sul secondo dedicato che ha 4 IP in tutto associati allora diventa irraggiungibile da qualunque host.

Al ticket ho allegato traceroute che fanno vedere quali dedicati riescono a pingare quell'IP e quali no, e si vede anche che i pacchetti si fermano nei router intermedi e non sulle mie macchine.

Basterebbe che la segnalazione arrivasse a qualcuno che sa come funziona il routing interno di OVH (o meglio basterebbe che arrivasse a qualcuno che legge e capisce quello che scrivo, invece di rispondermi come se fossi un utonto).

torpado
04.02.2010, 10.29
Citazione Originariamente Scritto da bago
Ciao a tutti,

visto che il supporto ovh a ticket è di una lentezza incredibile e, oltretutto, non mi ha dato risposte provo a condividere i problemi qui.

Così il 18 gennaio ho aperto il ticket #346794 per segnalare che i reverse per la mia classe c non funzionavano. Ho spiegato il problema esaustivamente in italiano ed inglese.

Dopo 3 giorni, nessuna risposta, ho sollecitato.

Dopo 7 giorni ricevo una risposta in italiano "scarso" che dice che non è possibile acquistare blocchi di IP ripe al momento: ma chi l'ha chiesto? OVH non dovrebbe mettere a ripondere ai ticket persone che almeno sono in grado di leggere (e capire) la domanda?

C'è uno scambio di un altro paio di messaggi in cui OVH continua a rispondere a domande che io non ho fatto e a non risolvere il problema.

Al decimo giorno, dopo i messaggi precedenti mi viene chiuso il ticket con la giustificazione "Attualmente, i blocchi ip ripe non sono disponibili.". Ma scherziamo?? Please, mettete qualcuno che sappia interpretare l'italiano o l'inglese altrimenti è peggio che non avere supporto.

Comunque dopo un altro paio di giorni (11 dall'inizio) il problema sembra essere scomparso ed ora i reverse vanno. Quindi nessuno ha saputo dirmi cosa c'era che non andava e nemmeno cosa è stato fatto per risolvere, ma almeno adesso va. Incrocio le dita che non sia un problema che si può ripresentare in qualunque istante.

Comincio ad associare un paio dei nuovi IP ad alcune VM e scopro che mentre con un ip (188.*.*.13) non ho alcun problema e riesco ad usarlo, e addirittura a fare una migrazione live (proxmox kvm su drbd) tra i due dedicati, invece l'altro ip (188.*.*.12) ha un comportamento assurdo. Quando si trova su uno dei due server fisici non è raggiungibile in alcun modo, mentre quando si trova sull'altro è raggiungibile ma solo da alcuni punti. In pratica ho altri server in OVH: alcuni di questi riescono a pingarlo, altri no.

Apro un ticket (#359313 ) in data 2 febbraio spiegando esattamente tutto il problema (nuovamente in italiano e inglese) e per ora ancora nessuna risposta.

Visto che ho letto nel forum inglese che casi similari (di routing di ip failover anomali) sono capitati anche in passato e normalmente era un problema lato OVH speravo che si potesse risolvere in fretta. (sembra che alcuni router OVH vengano aggiornati ed altri no)

In pratica dal 14 gennaio ho comprato 2 server e una classe C e ancora non sono in grado di cominciare ad utilizzarla per problemi di OVH.

Passi per la disponibilità di 1 ora che sappiamo trasformarsi quasi sempre in qualche giorno, ma se poi quando i server vengono consegnati non funzionano per settimane allora diventa veramente critico.
Ho preso in carico la tua segnalazione

bago
04.02.2010, 10.03
Ciao a tutti,

visto che il supporto ovh a ticket è di una lentezza incredibile e, oltretutto, non mi ha dato risposte provo a condividere i problemi qui.

Così il 18 gennaio ho aperto il ticket #346794 per segnalare che i reverse per la mia classe c non funzionavano. Ho spiegato il problema esaustivamente in italiano ed inglese.

Dopo 3 giorni, nessuna risposta, ho sollecitato.

Dopo 7 giorni ricevo una risposta in italiano "scarso" che dice che non è possibile acquistare blocchi di IP ripe al momento: ma chi l'ha chiesto? OVH non dovrebbe mettere a ripondere ai ticket persone che almeno sono in grado di leggere (e capire) la domanda?

C'è uno scambio di un altro paio di messaggi in cui OVH continua a rispondere a domande che io non ho fatto e a non risolvere il problema.

Al decimo giorno, dopo i messaggi precedenti mi viene chiuso il ticket con la giustificazione "Attualmente, i blocchi ip ripe non sono disponibili.". Ma scherziamo?? Please, mettete qualcuno che sappia interpretare l'italiano o l'inglese altrimenti è peggio che non avere supporto.

Comunque dopo un altro paio di giorni (11 dall'inizio) il problema sembra essere scomparso ed ora i reverse vanno. Quindi nessuno ha saputo dirmi cosa c'era che non andava e nemmeno cosa è stato fatto per risolvere, ma almeno adesso va. Incrocio le dita che non sia un problema che si può ripresentare in qualunque istante.

Comincio ad associare un paio dei nuovi IP ad alcune VM e scopro che mentre con un ip (188.*.*.13) non ho alcun problema e riesco ad usarlo, e addirittura a fare una migrazione live (proxmox kvm su drbd) tra i due dedicati, invece l'altro ip (188.*.*.12) ha un comportamento assurdo. Quando si trova su uno dei due server fisici non è raggiungibile in alcun modo, mentre quando si trova sull'altro è raggiungibile ma solo da alcuni punti. In pratica ho altri server in OVH: alcuni di questi riescono a pingarlo, altri no.

Apro un ticket (#359313 ) in data 2 febbraio spiegando esattamente tutto il problema (nuovamente in italiano e inglese) e per ora ancora nessuna risposta.

Visto che ho letto nel forum inglese che casi similari (di routing di ip failover anomali) sono capitati anche in passato e normalmente era un problema lato OVH speravo che si potesse risolvere in fretta. (sembra che alcuni router OVH vengano aggiornati ed altri no)

In pratica dal 14 gennaio ho comprato 2 server e una classe C e ancora non sono in grado di cominciare ad utilizzarla per problemi di OVH.

Passi per la disponibilità di 1 ora che sappiamo trasformarsi quasi sempre in qualche giorno, ma se poi quando i server vengono consegnati non funzionano per settimane allora diventa veramente critico.