Алфавит языка — это тот набор символов (знаков), который допустим в данном языке. В алфавит языка C# входят:
-
прописные и строчные буквы (латинские и национальных шрифтов) и символ подчеркивания (_);
-
цифры;
-
специальные знаки: ' " , фигурные скобки | [ ] ( ) + - / \ % ? ! . ; : < = > & * ~ ^
-
неотображаемые символы («обобщенные пробельные символы»), они используются для отделения лексем друг от друга (это пробелы, табуляция, переход на новую строку).
Из отдельных символов алфавита языка строятся более крупные блоки программы: лексемы, директивы препроцессора и комментарии.
Лексема — это последовательность из одного или несколько символов, представляющая определенный смысл. Лексемам в языке человека соответствует понятие слово. В литературе, посвященной трансляции с языков программирования, часто используется термин токен, имеющий тот же смысл. Существует несколько видов лексем:
-
идентификаторы (имена объектов);
-
ключевые (зарезервированные, служебные) слова;
-
знаки операций;
-
разделители;
-
литералы.