Введение
Вам когда-нибудь приходилось преобразовывать данные из одного формата в другой? Преобразование данных — это стандартная задача разработчиков. Если вы пытаетесь извлечь информацию из журналов или входящих потоков, вам часто приходится работать с необработанными данными и преобразовывать их, чтобы привести в подходящий формат.
В этом модуле вы узнаете, как выполнять первичную обработку (преобразование) данных с помощью оболочки UNIX. Вы ознакомитесь с распространенными инструментами и основами регулярных выражений.
Цели обучения
В этом модуле рассматриваются следующие задачи:
- Выполнение базовой проверки файлов с помощью таких команд, как
head
,tail
,wc
,nl
иsort
. - С помощью команды
cat
можно создавать, добавлять, отображать и объединять файлы. - Напишите и используйте простые регулярные выражения для сопоставления текстовых шаблонов. (Это только общее введение в регулярные выражения.)
- Используйте вместе с регулярным выражением команду
grep
для поиска в файлах или содержимоеstdin
для сопоставления шаблонов. - Для базовых преобразований текста во входных потоках используйте
sed
и регулярное выражение. - Использование каналов и фильтров для первичной обработки данных.
Необходимые компоненты
- Базовое представление о командной строке и основных командах оболочки