Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Примечание. Если вы новичок, рассмотрите возможность использования CNTK средства чтения текстового формата. В будущем LMSequenceReader будет нерекомендуем и в конечном итоге не поддерживается.
LMSequenceReader — это средство чтения, которое считывает текстовую строку. Он чаще всего используется для задач моделирования языка. Примером его установки является следующий пример:
reader = [
readerType = "LMSequenceReader"
randomize = false
nbruttineachrecurrentiter = 10
unk = "<unk>"
wordclass = "$DataDir$\wordclass.txt"
file = "$DataDir$\penntreebank.train.txt"
labelIn = [
labelDim = 10000
beginSequence = "</s>"
endSequence = "</s>"
]
]
LMSequenceReader имеет следующие параметры:
randomize: это либоNoneилиAuto. Это указывает режим, определяющий, выполняется ли рандомизация предложения для всего тела.nbruttsineachrecurrentiter: указывает ограничение числа предложений в мини-пакете. Средство чтения упорядочивает входные предложения одинаковой длины до указанного предела в каждом мини-батче. Для повторяющихся сетей тренер сбрасывает действия скрытого слоя только в начале предложений. Действия скрытых слоев переносятся на следующий мини-бат, если конец предложения не достигнут. Использование нескольких предложений в мини-пакете может ускорить процесс обучения.unk: указывает символ, представляющий невидимые входные символы. Обычно этот символ имеет значение "". Невидимые слова будут сопоставлены с символом.wordclass: указывает сведения о классе слов. Он используется для моделирования языка на основе классов. Ниже приведен пример сведений о классе. Первый столбец — это индекс слова. Второй столбец — количество вхождений, третий столбец — слово, а последний — идентификатор класса слова.0 42068 </s> 01 50770 the 02 45020 <unk> 03 32481 N 04 24400 of 05 23638 to 06 21196 a 07 18000 in 18 17474 and 1file: файл содержит текстовые строки. Пример представлен ниже. В этом примере также можно заметить один вложенный блок с именемlabelIn.Пьер N лет присоединится к совету в качестве неисключительного директора ноябрь. N mr. является председателем голландской издательской группы n.v.
labelIn: раздел для входной метки. Он содержит следующие настройки.beginSequence— символ начала предложения.endSequence— символ окончания предложения.labelDim— измерение меток. Обычно это означает размер словаря.