[ITNOG] Problemi con Bitstream ed IWF

Marco Marzetti marco@lamehost.it
Mar 23 Dic 2014 12:39:10 CET


Buongiorno,

Vi scrivo per condividere un problema che facciamo fatica ad 
identificare con precisione.

Come molti qui, raccogliamo accessi ADSL tramite l'offerta Bistream GbE 
di TI.

Di seguito vi riporto uno schema sommario della rete:

+-----+   PPPoA  +----------+   PPPoE  +--------+  PPPoE  +------+
| CPE | ---------| DSLAM TI | ---------| GbE TI |---------| BRAS |
+-----+          +----------+          +--------+         +------+

Dopo il riavvio di un BRAS ( Cisco con IOS-XE ), la CPE si accorge del 
fermo, resetta il proprio stato e tenta di rinegoziare la sessione PPP.

Inizialmente tutto funziona come previsto: i due apparati attraversano 
tutti i processi tipici del setup di una sessione PPP finchè non 
arrivano a negoziare la parte LCP.

A quel punto le comunicazioni si fermano ed il processo va in timeout

Da quello che abbiamo potuto capire, la CPE invia richieste che non 
vengono consegnate al BRAS.

Vi riporto l'output di quello che vedo su un Cisco 1800:

.Nov  5 23:16:33.310: Vi2 LCP: O CONFREQ [REQsent] id 245 len 41
.Nov  5 23:16:33.310: Vi2 LCP:    MRU 1492 (0x010405D4)
.Nov  5 23:16:33.310: Vi2 LCP:    MagicNumber 0xF99E6153 (0x0506F99E6153)
.Nov  5 23:16:33.310: Vi2 LCP:    MRRU 1524 (0x110405F4)
.Nov  5 23:16:33.310: Vi2 LCP:    EndpointDisc 1 login_test@adsl
.Nov  5 23:16:33.310: Vi2 LCP:     (0x1317016D6F62655F636F6C6F676E6540)
.Nov  5 23:16:33.310: Vi2 LCP:     (0x71636F6D2E6974)deb
.Nov  5 23:16:35.326: Vi2 LCP: Timeout: State REQsent

Abbiamo testato CPE di marche differenti riscontrando lo stesso risultato.

Passare da PPPoA a PPPoE ( ed eliminare l'IWF ) non risolve nulla.

Nemmeno uno shutdown forzato della porta del DSLAM da parte dei tecnici 
di TI ripristina la situazione.

L'unica soluzione è far cadere la portante ATM lato CPE ( con uno shut 
dell'interfaccia ATM o con un reset del router ).

La mia opinione è che alcuni dei DSLAM di TI non riescano a gestire 
correttamente il timeout della sessione PPP quando la causa sta sulle 
porte d'aggregazione invece che su quelle verse i clienti.

Non riesco a trovare riscontri di quanto ho descritto su altre ML, per 
cui chiedo a voi se vi siate accorti di problemi simili.

Grazie


Maggiori informazioni sulla lista itnog