OVH Community, your new community space.

Bad file descriptor


raffo
04.12.2009, 01.49
Se hai un problema ricorrente, ogni 15 giorni dopo l'installazione, ti consiglio di cambiare configurazione software.

Installa Debian5, installa LAMP o LEMP, installa webmin e hai una tua "Release2" in versione aggiornata e light

Questa è una soluzione per avere lo stesso risultato ma con onfigurazione leggermente diversa e aggiornata.

Se vuoi risolvere il problema senza reinstallare, con queste informazioni non consigliarti altro che consultare i logs quando vai su webmin e trovi questo errore e poi scriverli qui.

Un'altra cosa che mi viene in mente ora; Webmin si basa su delle librerie Perl, non credo che in questo caso influisca ma visto che andiamo per tentativi, prova ad aggiornare Perl e le sue librerie.

pierangelo
02.12.2009, 22.29
Questo è quello che viene fuori in rescue mode: (ssh normale non funziona più)
Filesystem Size Used Avail Use% Mounted on
rootfs 491M 43M 449M 9% /
none 491M 43M 449M 9% /
df: `/nfs': Permission denied
df: `/power': Permission denied
tmpfs 491M 0 491M 0% /lib/init/rw
tmpfs 10M 68K 10M 1% /dev
tmpfs 491M 0 491M 0% /dev/shm
/dev/sda1 9.7G 3.4G 5.9G 37% /mnt

La partizione sda1 (che è la root originaria) ha spazio a volontà!
sic!

raffo
01.12.2009, 21.07
Prova anche a fare uno SMART Test sui dischi.
Se fallisce, il disco è danneggiato e OVH te lo cambierà in breve. Se è integro, il problema si ristringe ai software e molto probbabilmente ai logs. (basta spostarli!)

Codice:
smartctl -Hc /dev/sda
Controlla la linea
Codice:
SMART overall-health self-assessment test result: PASSED
RAFFAELE

raffo
30.11.2009, 23.14
Molti hanno avuto il tuo stesso problema

Diversi hanno aggirato il problema reinstallando, ma cosi non si risolve..

pierangelo
30.11.2009, 22.57
Ho la release 2 di ovh ed ho tutto di default, ora provo in rescue mode.
grazie

raffo
30.11.2009, 22.15
Avvia in rescue-pro, monta il disco su punto di montaggio comunemente usato /mnt, controlla la capacità delle partizioni.

Ogni demone ha dei logs di default.
Apache penso sia quelloche occupa piu spazio nei logs se abilitato access.log.

Comunque che distro hai? che versione di apache hai installato?
hai altri demoni/servizi particolari?

pierangelo
30.11.2009, 22.11
Si penso di si, cmq ssh non funziona , il filemanager di webmin va ma non trovo dove sta la cartella log su questa distro!

raffo
30.11.2009, 21.55
Se hai installato la Quota sul disco, assicurati che non sia andato oltre il limite.
Comunque sono sospettoso sulla partizione / che suppongo sia full

Fammi sapere.

pierangelo
30.11.2009, 21.41
Beh, grazie questa è una risposta "tecnica".
Provo

raffo
30.11.2009, 21.35
Dovresti analizzare le ultime attività avviate che ci sono state prima del crash.
Dovresti anche controllare l'integrità del disco, magari facendo un test riempiendolo e vedendo quanto ci mette a scrivere una determinata somma di GB..

Vai sulla partizione piu capiente e avvia:

Codice:
dd if=/dev/zero of=fakedisk bs=5k count=100000
il mio output:
Codice:
dd if=/dev/zero of=fakedisk bs=5k count=100000
100000+0 records in
100000+0 records out
512000000 bytes (512 MB) copied, 1.46136 seconds, 350 MB/s
Aumenta il count= per aumentare la dimensione da copiare sul file fakedisk.

Riempi il disco, se è troppo lento o se dopo un determinato sforzo del disco il server si riavvia o si corrompe il filesystem, allora hai l'hard disk danneggiato.

Seconda soluzione per controllare l'integrità del tuo FS è di usare e2fsck.
http://linux.die.net/man/8/e2fsck

hai un software di monitoraggio del tuo sistema?
Installa Munin, ti puo aiutare a scoprire parte dei problemi, se confrontato con l'utilizzo che fai del server.

Prova anche a controllare la dimensione delle tue partizioni, se fai un'installazione senza personalizzare la tabella delle partizioni, OVH di default usa / 5GB e il restante su /home.

/etc/webmin/webmin/oscache è su / e se hai una cache o dei logs, probabilmente riempiono la partizione causando errori ad altre applicazioni.

Avvia il comando df, per vedere lo stato dei punti di montaggio a livello di capacità di spazio.

esempio:
Codice:
# df -h
Filesystem         Dimens. Usati Disp. Uso% Montato su
/dev/sda1             9,7G  5,9G  3,3G  65% /
/dev/sda2              87G  9,1G   74G  11% /usr
/dev/sda3              87G  5,6G   77G   7% /var
/dev/sda5             9,7G  144M  9,0G   2% /tmp
/dev/sda6             1,2T  297G  818G  27% /home
/dev/sdc1             1,4T  303G 1004G  24% /web3
/dev/sdd1             1,4T  3,6G  1,3T   1% /web
/dev/sdb1             1,4T  901G  405G  70% /web1
RAFFAELE

pierangelo
30.11.2009, 21.03
In giro non ho trovato nulla al riguardo, quell'errore su phplist fa riferimento ad una corruzione dell'installazione, a me si è corrotto il sistema operativo:
Apertura di //etc/webmin/webmin/oscache in fase di scrittura non riuscita: Bad file descriptor
Questo esce fuori da webmin su tutti i moduli.
Sono un sistemista Window e non Linux, ma credo che alcune cose siano uguali, se utilizzi un server web ed un DB al massimo che può succedere si corrompe il DB o i file del sito web, non mi si può corrompere tutto il FS, a me succede questo, ed è la seconda volta in 15 giorni, utilizzo applicazioni banali, ho contattato l'assistenza ed ho ricevuto l'ennesima risposta ...... mandaci i log ecc, ecc.
Capisco che non si possono verificare tutti i problemi software degli utenti, ma se uno fa una segnalazione dettagliata e circostanziata, un minimo di controllo andrebbe fatto, non ho scritto che la pagina web invece di blu si vede verde, ho scritto che le stesse cose su un server funzionano da mesi, su un altro fanno crashare il server ogni 15 giorni, la differenza è forse che sull'altro pago la "sicurezza" e su questo no?

--

Faccio un'altra reinstallazione, ma è ovvio che se il supporto è questo cambio ISP, ed ho con voi 8 server virtuali e trenta domini registrati.

Saluti

P.S. tempo fa ho avuto una discussione analoga, con un rps, la colpa era mia, ero incompetente, ecc, ecc, invece ho scoperto un bug su webmin, con i kimsufy funziona con gli rps no...

raffo
29.11.2009, 20.58
Che errore ti da avviando il server in vKVM su HD?

calabriaunix
25.11.2009, 22.57
http://forums.phplist.com/viewtopic.php?f=24&t=8330

Se comunque fai una ricerca sull'argomento trovi qualche spunto, un filesystem non si auto-corrompe, è quasi sempre il codice buggato nella maggior parte dei casi a portare guai.

pierangelo
25.11.2009, 15.08
Ho un Kimsufy con semplici siti web ed una newsletter corposa con phplist (che è una copia di un'altra installata sun un altro kimsufy).
Ai primi di novembre non funziona più nulla, e su webmin mi compariva:
Apertura di //etc/webmin/webmin/oscache in fase di scrittura non riuscita: Bad file descriptor, su quasi tutte le pagine, ho fatto vari controlli e risultava il file system corrotto, nulla da fare ho dovuto reinstallare il server, adesso dopo 15 giorni stesso problema, con praticamente il server mai utilizzato, inviata solo una newsletter, in rescue tutto a posto.
Qualcuno sa perchè il filesystem si corrompe così facilmente?