Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Uwaga: jeśli jesteś nowym użytkownikiem, rozważ użycie CNTK czytnika formatów tekstu. W przyszłości element LMSequenceReader zostanie wycofany i ostatecznie nie będzie obsługiwany.
LMSequenceReader to czytnik, który odczytuje ciąg tekstowy. Jest on najczęściej używany do zadań modelowania języka. Przykład konfiguracji jest następujący
reader = [
readerType = "LMSequenceReader"
randomize = false
nbruttineachrecurrentiter = 10
unk = "<unk>"
wordclass = "$DataDir$\wordclass.txt"
file = "$DataDir$\penntreebank.train.txt"
labelIn = [
labelDim = 10000
beginSequence = "</s>"
endSequence = "</s>"
]
]
Element LMSequenceReader ma następujące parametry:
randomize: jest to wartośćNonelubAuto. Określa tryb wykonywania losowych zdań całego korpusu.nbruttsineachrecurrentiter: określa limit liczby zdań w minibatch. Czytelnik rozmieszcza zdania wejściowe o tej samej długości, do określonego limitu, do każdego minibatcha. W przypadku cyklicznych sieci trener resetuje ukryte działania warstwowe tylko na początku zdań. Działania ukrytych warstw są przenoszone do następnej minibatch, jeśli nie zostanie osiągnięty koniec zdania. Używanie wielu zdań w minibatch może przyspieszyć procesy trenowania.unk: określa symbol do reprezentowania nieużytowanych symboli wejściowych. Zazwyczaj ten symbol to "". Niezamierzone słowa zostaną zamapowane na symbol.wordclass: określa informacje o klasie wyrazów. Jest to używane do modelowania języka opartego na klasach. Poniżej przedstawiono przykład informacji o klasie. Pierwsza kolumna to indeks wyrazów. Druga kolumna to liczba wystąpień, trzecia kolumna to słowo, a ostatnia kolumna to identyfikator klasy wyrazu.0 42068 </s> 01 50770 the 02 45020 <unk> 03 32481 N 04 24400 of 05 23638 to 06 21196 a 07 18000 in 18 17474 and 1file: plik zawiera ciągi tekstowe. Poniżej przedstawiono przykład. W tym przykładzie można również zauważyć jeden pod blok o nazwielabelIn.pierre N lat dołączy do zarządu jako nonexecutive dyrektor listopad. N pan jest przewodniczącym n.v. holenderskiej grupy publikacji
labelIn: sekcja etykiety wejściowej. Zawiera on następujące konfiguracjebeginSequence– symbol początkowy zdaniaendSequence– symbol końcowy zdanialabelDim– wymiar etykiet. Zwykle oznacza to rozmiar słownictwa.