Учебники

Обработка естественного языка – Начало

В этой главе мы обсудим возникновение естественного языка в обработке естественного языка. Для начала давайте разберемся, что такое грамматика естественного языка.

Грамматика естественного языка

Для лингвистики язык – это группа произвольных голосовых знаков. Можно сказать, что язык является творческим, подчиняется правилам, врожденным и универсальным одновременно. С другой стороны, это тоже по-человечески. Природа языка различна для разных людей. Существует много заблуждений относительно природы языка. Вот почему очень важно понимать значение неоднозначного термина «грамматика» . В лингвистике термин грамматика может быть определен как правила или принципы, с помощью которых работает язык. В широком смысле мы можем разделить грамматику на две категории –

Описательная грамматика

Набор правил, в которых лингвистика и грамматики формулируют грамматику говорящего, называется дескриптивной грамматикой.

Перспективная грамматика

Это совсем другое чувство грамматики, которое пытается поддерживать стандарт правильности в языке. Эта категория имеет мало общего с фактической работой языка.

Компоненты языка

Язык обучения делится на взаимосвязанные компоненты, которые являются как обычными, так и произвольными разделами лингвистического исследования. Объяснение этих компонентов заключается в следующем –

Фонология

Самым первым компонентом языка является фонология. Это изучение звуков речи определенного языка. Происхождение слова можно проследить до греческого языка, где «телефон» означает звук или голос. Фонетика, подразделение фонологии, – это изучение речевых звуков человеческого языка с точки зрения их производства, восприятия или их физических свойств. IPA (Международный фонетический алфавит) – это инструмент, который регулярно отображает звуки человека при изучении фонологии. В IPA каждый письменный символ представляет один и только один речевой звук и наоборот.

фонемы

Это может быть определено как одна из единиц звука, которые отличают одно слово от другого в языке. В лингвистике фонемы пишутся между слешами. Например, фонема / k / встречается в таких словах, как kit, skit.

Морфология

Это второй компонент языка. Это изучение структуры и классификации слов в определенном языке. Происхождение слова происходит от греческого языка, где слово «морфе» означает «форма». Морфология рассматривает принципы формирования слов в языке. Другими словами, как звуки объединяются в значимые единицы, такие как префиксы, суффиксы и корни. Это также рассматривает, как слова могут быть сгруппированы в части речи.

лексема

В лингвистике абстрактная единица морфологического анализа, которая соответствует набору форм, взятых одним словом, называется лексемой. Способ использования лексемы в предложении определяется его грамматической категорией. Лексема может быть отдельным словом или несколькими словами. Например, слово talk является примером отдельного слова lexeme, которое может иметь много грамматических вариантов, таких как разговоры, разговоры и разговоры. Лексема из нескольких слов может состоять из нескольких орфографических слов. Например, говорить, тянуть и т. Д. Являются примерами многословных лексем.

Синтаксис

Это третий компонент языка. Это изучение порядка и расположения слов в более крупные единицы. Слово можно проследить до греческого языка, где слово suntassein означает «навести порядок». Он изучает тип предложений и их структуру, предложения, фразы.

Семантика

Это четвертый компонент языка. Это изучение того, как передается смысл. Значение может быть связано с внешним миром или может быть связано с грамматикой предложения. Слово можно проследить до греческого языка, где слово semainein означает «обозначать», «показывать», «сигнал».

Прагматика

Это пятый компонент языка. Это изучение функций языка и его использование в контексте. Происхождение слова можно проследить до греческого языка, где слово «прагма» означает «поступок», «дело».

Грамматические категории

Грамматическая категория может быть определена как класс единиц или признаков в грамматике языка. Эти единицы являются строительными блоками языка и имеют общий набор характеристик. Грамматические категории также называют грамматическими особенностями.

Инвентаризация грамматических категорий описана ниже –

Число

Это самая простая грамматическая категория. У нас есть два термина, относящихся к этой категории – сингулярный и множественный. Единственное число – это понятие «один», тогда как множественное число – это понятие «более чем один». Например, собака / собаки, это / эти.

Пол

Грамматический пол выражен изменением в личных местоимениях и третьем лице. Примеры грамматических родов единственного числа – он, она, это; формы первого и второго лица – я, мы и вы; 3-е лицо во множественном числе образует общий или средний род.

Человек

Другая простая грамматическая категория – человек. При этом признаются следующие три условия:

  • 1-е лицо – говорящее лицо считается 1-м лицом.

  • 2-е лицо – лицо, которое является слушателем или человеком, с которым говорят, признается 2-м лицом.

  • Третье лицо – лицо или предмет, о котором мы говорим, признается третьим лицом.

1-е лицо – говорящее лицо считается 1-м лицом.

2-е лицо – лицо, которое является слушателем или человеком, с которым говорят, признается 2-м лицом.

Третье лицо – лицо или предмет, о котором мы говорим, признается третьим лицом.

случай

Это одна из самых сложных грамматических категорий. Он может быть определен как указание на функцию именной фразы (NP) или отношения существительной фразы к глаголу или к другим именным фразам в предложении. У нас есть следующие три случая, выраженные в личных и вопросительных местоимениях –

  • Именительный падеж – это функция субъекта. Например, я, мы, вы, он, она, она, они и кто именительный.

  • Родительный падеж – это функция владельца. Например, мой / мой, наш / наш, его, ее / ее, его, их / их, которые являются родительными.

  • Объективный случай – это функция объекта. Например, я, мы, вы, он, она, они, которые являются объективными.

Именительный падеж – это функция субъекта. Например, я, мы, вы, он, она, она, они и кто именительный.

Родительный падеж – это функция владельца. Например, мой / мой, наш / наш, его, ее / ее, его, их / их, которые являются родительными.

Объективный случай – это функция объекта. Например, я, мы, вы, он, она, они, которые являются объективными.

степень

Эта грамматическая категория связана с прилагательными и наречиями. Он имеет следующие три условия –

  • Положительная степень – это выражает качество. Например, большие, быстрые, красивые – это положительные степени.

  • Сравнительная степень – выражает большую степень или интенсивность качества в одном из двух пунктов. Например, больше, быстрее, красивее сравнительные степени.

  • Превосходная степень – выражает наибольшую степень или интенсивность качества в одном из трех или более элементов. Например, самые большие, самые быстрые, самые красивые – это превосходные степени.

Положительная степень – это выражает качество. Например, большие, быстрые, красивые – это положительные степени.

Сравнительная степень – выражает большую степень или интенсивность качества в одном из двух пунктов. Например, больше, быстрее, красивее сравнительные степени.

Превосходная степень – выражает наибольшую степень или интенсивность качества в одном из трех или более элементов. Например, самые большие, самые быстрые, самые красивые – это превосходные степени.

Определенность и неопределенность

Обе эти концепции очень просты. Определенность, как мы знаем, представляет референта, который известен, знаком или опознаваем говорящим или слушателем. С другой стороны, неопределенность представляет референта, который не известен или незнаком. Понятие может быть понято в совместном появлении статьи с существительным –

  • определенная статья

  • неопределенный артикльа / п

определенная статья

неопределенный артикльа / п

Время

Эта грамматическая категория относится к глаголу и может быть определена как лингвистическое указание времени действия. Время устанавливает отношение, потому что оно указывает время события относительно момента речи. В общих чертах, он имеет следующие три типа –

  • Настоящее время – представляет возникновение действия в настоящий момент. Например, Рам много работает.

  • Прошедшее время – представляет собой действие до настоящего момента. Например, шел дождь.

  • Будущее время – представляет возникновение действия после настоящего момента. Например, будет дождь.

Настоящее время – представляет возникновение действия в настоящий момент. Например, Рам много работает.

Прошедшее время – представляет собой действие до настоящего момента. Например, шел дождь.

Будущее время – представляет возникновение действия после настоящего момента. Например, будет дождь.

аспект

Эта грамматическая категория может быть определена как точка зрения на событие. Это может быть следующих типов –

  • Идеальный аспект – представление воспринимается как единое целое в аспекте. Например, простое прошедшее время, как вчера, когда я встретил своего друга, на английском языке является совершенным в аспекте, поскольку оно рассматривает событие как завершенное и целостное.

  • Несовершенный аспект – точка зрения воспринимается как продолжающаяся и неполная в аспекте. Например, настоящее причастное время, как я работаю над этой проблемой, на английском языке несовершенно в аспекте, поскольку рассматривает событие как незавершенное и продолжающееся.

Идеальный аспект – представление воспринимается как единое целое в аспекте. Например, простое прошедшее время, как вчера, когда я встретил своего друга, на английском языке является совершенным в аспекте, поскольку оно рассматривает событие как завершенное и целостное.

Несовершенный аспект – точка зрения воспринимается как продолжающаяся и неполная в аспекте. Например, настоящее причастное время, как я работаю над этой проблемой, на английском языке несовершенно в аспекте, поскольку рассматривает событие как незавершенное и продолжающееся.

Настроение

Эту грамматическую категорию немного сложно определить, но ее можно просто сформулировать как показатель отношения говорящего к тому, о чем он / она говорит. Это также грамматическая особенность глаголов. Это отличается от грамматического времени и грамматического аспекта. Примерами настроений являются показательный, вопросительный, императивный, запретительный, сослагательный, потенциальный, факультативный, герундии и причастия.

соглашение

Это также называется Конкорд. Это происходит, когда слово меняется в зависимости от других слов, к которым оно относится. Другими словами, это подразумевает согласование значения некоторой грамматической категории между разными словами или частью речи. Ниже приведены соглашения, основанные на других грамматических категориях –

  • Соглашение, основанное на личности – это соглашение между субъектом и глаголом. Например, мы всегда используем «Я есть» и «Он есть», но никогда не «Он есть» и «Я есть».

  • Соглашение на основе числа – это соглашение между субъектом и глаголом. В этом случае существуют определенные формы глагола для первого лица единственного числа, второго лица множественного числа и так далее. Например, 1-е лицо единственного числа: я на самом деле, 2-е лицо множественного числа: мы на самом деле, 3-го лица единственного числа: мальчик поет, 3-го лица множественного числа: мальчики поют.

  • Соглашение, основанное на полу – В английском языке существует соглашение в отношении пола между местоимениями и антецедентами. Например, он достиг своей цели. Корабль достиг ее пункта назначения.

  • Соглашение, основанное на случае – этот вид соглашения не является существенной чертой английского языка. Например, кто пришел первым – он или его сестра?

Соглашение, основанное на личности – это соглашение между субъектом и глаголом. Например, мы всегда используем «Я есть» и «Он есть», но никогда не «Он есть» и «Я есть».

Соглашение на основе числа – это соглашение между субъектом и глаголом. В этом случае существуют определенные формы глагола для первого лица единственного числа, второго лица множественного числа и так далее. Например, 1-е лицо единственного числа: я на самом деле, 2-е лицо множественного числа: мы на самом деле, 3-го лица единственного числа: мальчик поет, 3-го лица множественного числа: мальчики поют.

Соглашение, основанное на полу – В английском языке существует соглашение в отношении пола между местоимениями и антецедентами. Например, он достиг своей цели. Корабль достиг ее пункта назначения.

Соглашение, основанное на случае – этот вид соглашения не является существенной чертой английского языка. Например, кто пришел первым – он или его сестра?

Синтаксис разговорного языка

Письменная грамматика английского и разговорного английского языка имеет много общих черт, но наряду с этим они также отличаются по ряду аспектов. Следующие особенности различают устную и письменную грамматику английского языка –

Неисправности и ремонт

Эта поразительная особенность делает грамматику разговорной и письменной речи отличной друг от друга Он индивидуально известен как явления нарушения и все вместе как явления ремонта. Несоответствия включают использование следующего –

  • Заполняющие слова. Иногда между предложениями мы используем некоторые заполняющие слова. Их называют наполнителями паузы наполнителя. Примеры таких слов: хм и гм.

  • Репарандум и исправление . Повторяющаяся часть слов между предложениями называется репарандумом. В том же сегменте измененное слово называется ремонт. Рассмотрим следующий пример, чтобы понять это –

Заполняющие слова. Иногда между предложениями мы используем некоторые заполняющие слова. Их называют наполнителями паузы наполнителя. Примеры таких слов: хм и гм.

Репарандум и исправление . Повторяющаяся часть слов между предложениями называется репарандумом. В том же сегменте измененное слово называется ремонт. Рассмотрим следующий пример, чтобы понять это –

Предлагает ли авиакомпания ABC перелеты в одну сторону или в одну сторону за 5000 рупий?

В приведенном выше предложении рейс в одну сторону – это репарадум, а рейсы в одну сторону – ремонт.

Перезапуск

После паузы наполнителя происходит перезапуск. Например, в приведенном выше предложении перезапуски происходят, когда говорящий начинает спрашивать о перелетах в одну сторону, затем останавливается, исправляет себя с помощью паузы, а затем снова начинает спрашивать о тарифах в одну сторону.

Фрагменты слова

Иногда мы говорим предложения с меньшими фрагментами слов. Например, какое время? Здесь слова w-wha являются фрагментами слова.