С exception handling под капотом или как же работают исключения в C

С++ exception handling под капотом или как же работают исключения в C++

В мире победили языки высокого уровня и в мирах руби-питон-js разработчиков остается только разглагольствовать, что в плюсах не стоит использовать то или иное. Например, исключения, потому что они медленные и генерируют много лишнего кода. Стоило спросить «и какой же код он генерирует», как в ответ получил мямленье и мычание. А и правда — как же они работают? Ну что ж, компилируем в g++ с флагом — S, смотрим что получилось. Поверхностно разобраться не сложно, однако то, что остались недопонимания — не давали мне спать. К счастью, готовая статья нашлась.

На хабре есть несколько статей, подробных и не очень (при этом все равно хороших), посвященных тому, как работают exceptions в C++. Однако нет ни одной по-настоящему глубокой, поэтому я решил восполнить этот пробел, благо есть подходящий материал. Кому интересно как работают исключения в C++ на примере gcc — запаситесь pocket-ом или evernote, свободным временем и добро пожаловать под кат.

2 часть
3 часть

P. S. Пару слов о переводе:

  • перевод очень очень близкий к тексту, но иногда я позволял себе изменять целые абзацы
  • некоторые термины я так и не придумал, как перевести, например landing pad и call site
  • Работы оказалось гораздо больше, чем казалось, к концу я даже стал путать, где перевод, а где оригинал, некоторые строки были написаны в 4 ночи, в общем — если где-то будут несвязные слова или целые предложения — простите, в ближайшее время постараюсь все подправить.
  • В данном случае код является неотъемлемой частью статьи, поэтому прятать под спойлер ничего не буду.
  • Как всегда, орфография, пунктуация и мелкие ошибки — в личку. Фактические ошибки, неточности и недоработки — в комментарии.

C++ исключения под капотом

Все знают, что обработка исключений трудна. Причин для этого предостаточно в каждом слое «жизненного цикла» исключения: сложно писать код с сильной гарантией безопасности по исключениям (exception safe code), исключения могут выбрасываться из неожиданных мест, может оказаться проблематичным попытка понять плохо спроектированную иерархию исключений, это медленно работает из-за большого количества вуду-магии под капотом, это опасно, поскольку неправильное пробрасывание ошибки может привести к непростительному вызову std::terminate . И, несмотря на все это, битвы по поводу использовать или нет исключения в программах все еще продолжаются. Вероятно, это из-за неглубокого понимания как же они работают.

Для начала нужно спросить себя: как это все работает? Это первая статья из длинной серии, которую я пишу о том, как реализованы исключения под капотом в C++ (под платформу gcc под x86, но должно быть применимо для других платформ так же). В этих статьях процес выброса и отлова ошибок будет объяснен во всех подробностях, но для нетерпеливых: короткий бриф всех статей о пробросе исключений в gcc/x86:

    Когда мы пишем оператор throw, компилятор транслирует его в пару вызовов функций libstdc++ , которые размещают исключение и начинаются быстрый процесс раскручивания стека вызовом библиотеки libstdc .

Даже сейчас это выглядит сложно, а ведь мы даже не начали, это было лишь короткое и неточное описание сложностей, необходимых для обработки исключений.

Для изучения всех деталей, происходящих под капотом, в следующей части мы начнем с реализации собственной мини-версии libstdlibc++ . Не всей, только части с обработкой ошибок. В реальности даже не всю эту часть, лишь необходимый минимум для реализации throw/catch блока. Также понадобится немного ассемблера, но лишь совсем совсем немного. Зато понадобится много терпения, к сожалению.

Если вы слишком любопытны, можете начинать тут. Это — полная спецификация того, что мы будем реализовывать в следующих частях. Я же попытаюсь сделать эту статью поучительной и более простой, чтобы в следующий раз вам было проще начинать с вашим собственным ABI (application binary interface, Двоичный интерфейс приложений — прим. переводчика).

Примечания (отказ от ответственности):
Я ни в коей мере не сведую в том, какая вуду-магия происходит, когда пробрасывается исключение. В этой статье я попытаюсь разоблачить тайное и узнать, как же оно устроено. Какие-то мелочи и тонкости будут не соответствовать действительности. Пожалуйста, дайте мне знать, если где-то что-то неправильно.

Прим. переводчика: это актуально и для перевода.

C++ exceptions под капотом: маленький ABI

Если мы попытаемся понять, почему исключения такие сложные и как они работают, мы можем либо утонуть в тоннах мануалов и документаций, либо попытаться отловить исключения самостоятельно. В действительности, я был удивлен отстутствием качественной информации по теме (прим. переводчика — я, к слову, тоже): все, что можно найти либо чересчур детально, либо слишком уж простое. Конечно же, есть спецификации (наиболее документировано: ABI for C++, но так же CFI, DWARF и libstdc), но обособленного чтение документации недостаточно, если вы действительно хотите понять, что происходит внутри.

Давайте начнем с очевидного: с переизобретения колеса! Мы знаем, что в чистом C нет исключений, так что попытаемся слинковать C++ программу линкером чистого C и посмотрим, что произойдет! Я начал с чего-то простого типа этого:

Не забудьте extern , иначе G++ услужливо выпилит нашу небольшую функцию и сделает невозможным для линковки с нашей программой на чистом C. Конечно же, нам нужен заголовочный файл для линковки (не каламбур), чтобы сделать возможным соединие миров C++ и C:

И очень простой main:

Что случится, если мы попытаемся скомпилировать и слинковать этот франкинкод?

Заметка: вы можете загрузить весь исходный код для этого проекта с моего гит-репозитория.

Пока что все хорошо. Оба, g++ и gcc, счастливы в своем маленьком мире. Хаос начнется сразу, как только мы попробуем их слинковать вместе:

Ну и конечно же, gcc жалуется на недостающие C++ объявления. Это очень специфичные C++ объявления. Посмотрите на последнюю строку ошибки: пропущена vtable для cxxabiv1 . cxxabi , объявленная в libstdc++ , ссылается на ABI для C++. Теперь мы знаем, что обработка ошибок выполняется с помощью стандартной C++ библиотеки с объявленным интерфейсом C++ ABI.

C++ ABI объявляет стандартный бинарный формат, с помощью которого мы можем слинковать объекты вместе в одной программе. Если мы скомпилируем. o файлы двумя разными компиляторами, которые используют разные ABI, то не сможем объединить их в одно приложение. ABI может так же объявлять разные другие стандарты, например, интерфейс для раскручивания стека или пробрасывания исключения. В этом случае ABI определяет интерфейс (не обязательно бинарный формат, просто интерфейс) между C++ и другими библиотеками в нашем приложении, которые обеспечивают раскрутку стэка. Иными словами — ABI определяет специфичные для C++ вещи, благодаря которым наше приложение может общаться с не-C++ библиотеками: это то, что позволит пробрасывать исключения из других языков, которые будут отловлены в C++, ну и множество других вещей.

В любом случае, ошибки линкера — точка отправления и первый слой в анализе работе исключений под капотом: интерфейс, который нам нужно реализовать — cxxabi . В следующей главе мы начнем с собственого мини-ABI, определенного в точности как C++ ABI.

C++ exceptions под капотом: угождаем линкеру, подпихнув ему ABI

В нашем путешествии в понимании исключений мы открыли, что вся тяжелая атлетика реализована в libstdc++ , определение которой дано в C++ ABI. Просматривая ошибки линкера мы вывели, что для обработки ошибок мы должны обратиться за помощью к C++ ABI; мы создали плюющуюся ошибками C++ программу, слинковали вместе с программой на чистом C и обнаружили, что компилятор каким-то образом транслирует наши throw инструкции во что-то, что теперь вызывает несколько libstd++ функций, которые непосредственно выбрасывают исключение.

Тем не менее, мы хотим понять как именно работают исключения, так что попробуем реализовать свой собственный mini-ABI, обеспечивающий механизм пробрасывания ошибок. Чтобы сделать это, нам понадобится лишь RTFM, однако полный интерфейс может быть найден тут, для LLVM. Вспомним-ка, каких конкретно функций недостает:

__cxa_allocate_exception

Имя самодостаточно, я полагаю. __cxa_allocate_exception принимает size_t и выделяет достаточное количество памяти для хранения исключения во время его пробрасывания. Это сложнее, чем кажется: когда ошибка обрабатывается, происходит некая магия со стеком, аллоцирование (прим. переводчика — да простите за это слово, но иногда я буду его использовать) в стеке — плохая идея. Выделение памяти в куче (heap), в общем, тоже плохая идея, потому что где будем выделять память при исключении, сигнализирующем о том, что память закончилась? Статичное (static) размещение в памяти так же плохая идея, покуда нам нужно сделать это потокобезопасным (иначе два конкурирующих потока, выбросившие исключения, приведут к катастрофе). Учитывая эти проблемы, наиболее выгодным выглядит выделение памяти в локальном хранилище потока (куче), однако при необходимости обращаться к аварийному хранилищу (предположительно, статичному), если память закончилась (out of memory). Мы, конечно же, не будем волноваться по поводу страшных деталей, так что можем просто использовать статичный буфер, если понадобится.

__cxa_throw

Эта функция делает всю магию пробрасывания! Согласно ABI, как только исключение было создано, должна вызываться __cxa_throw. Эта функция ответственна за вызов раскрутки стэка. Важный эффект: __cxa_throw никогда не предполагает возврат (return). Она так же передает управление подходящему catch-блок для обработки исключения либо вызывает (по-умолчанию) std::terminate , но никогда ничего не возвращает.

vtable для __cxxabiv1::__class_type_info

Странно… __class_type_info явно какая-то RTTI (run-time type information, run-time type identification, Динамическая идентификация типа данных), но какая именно? Пока нам не просто ответить на это, да и это не адски важно для нашего мини-ABI; оставим это части «приложение», которую мы приведем после завершения анализа процесса пробрасывания исключения, сейчас же давайте просто скажем, что это — точка входа определения ABI в рантайме, отвечающая на вопрос: «эти два типа одинаковы или нет». Это функция, которая вызывается, чтобы определить: может ли данный catch-блок обрабатывать эту ошибку или нет. Сейчас мы сфокусируемся на основном: нам необходимо дать её как адрес для линкера (т. е. определить её не достаточно, нужно еще её инициировать) и она должна иметь vtable (да да, она должна иметь виртуальный метод).

Много работы происходит в этих функциях, но давайте попробуем реализовать простейший метатель исключений: тот, который будет делать выход из программы (call exit), когда исключение выброшено. Наше приложение почти завершено, но пропущены некоторые ABI-функции, так что давайте создадим mycppabi. cpp. Читая нашу ABI-спецификацию, мы можем описать наши сигнатуры для __cxa_allocate_exception и __cxa_throw:

Напомню: вы можете найти исходники в моем github репозитории.

Если сейчас скомпилировать mycppabi. cpp и слинковать с другими двумя. o файлами, мы получим работающие бинарники, которые должны вывести «alloc ex 1\n throw» и, после этого, выйти. Очень просто, но, при этом, удивительно: мы управляем исключениями без вызова libc++: мы написали (очень очень маленькую) часть C++ ABI!

Другая важная часть мудрости, полученная нами при создании нашего собственного мини-ABI: ключевое слово throw компилируется в два вызова функций из libstdc++. Здесь нет никакой вуду-магии, это простая трансформация. Мы можем даже дизассемблировать нашу функцию чтобы проверить это. Запустим g++ — S throw. cpp

Даже больше магии: когда throw транслируется в эти два вызова, компилятор даже не знает, как исключение будет обрабатываться. Как только libstdc++ определяет __cxa_throw и её друзей, libstdc++ динамически линкуется в рантайме, метод обработки исключений может быть выбран при первом запуске приложения.

Мы уже видим прогресс, но нам еще стоит пройти огромный путь познания. Сейчас наш ABI может только выбрасывать исключения. Можем ли мы расширить его, чтобы он отлавливал ошибки? Что ж, посмотрим, как это сделать, в следующей главе!

C++ exceptions под капотом: отлов того, что бросаем

В этой статье мы немного приоткрыли завесу тайны о пробросе исключений, наблюдая за ошибками компилятора и линкера, но мы до сих пор далеки до понимания чего-либо об отлове ошибок. Резюмируем что мы уже выяснили:

  • throw-объявление будет транслировано компилятором в два вызова: __cxa_allocate_exception и __cxa_throw.
  • __cxa_allocate_exception и __cxa_throw «живут» в libstdc++ .
  • __cxa_allocate_exception выделяет память для нового исключения.
  • __cxa_throw выполняет подготовку и отдает исключение в _Unwind, в набор функций, которые живут в libstdc и производит реальное разворачивание стэка (ABI определяет интерфейс этих функций).

Как и ранее, мы имеем функцию seppuku, соединяющую C и C++ миры, только в этот раз мы добавили несколько вызовов функций, чтобы сделать наш стэк более интересным, также мы добавили ветви try/catch блоков, так что теперь мы можем анализировать как libstdc++ обрабатывает их.

И вновь получаем ошибки линковщика об отсутствующих ABI-функциях:

Мы опять видим кучу всего интересного. Вызов __cxa_begin_catch и __cxa_end_catch мы ожидали, хоть пока и не знаем, что они такое, но можем предположить, что они эквивалентны throw/__cxa_allocate/throw. __gxx_personality_v0 — что-то новое, и оно и будет основной темой следующих частей.

Что делает персональная функция? (при. переводчика — не придумал лучшего названия, подскажите в комментариях, если есть идеи). Мы уже что-то говорили о ней во введении, однако в следующий раз мы посмотрим на нее гораздо детальнее, как и на наших двух новых друзей: __cxa_begin_catch и __cxa_end_catch.

C++ exceptions под капотом: магия вокруг __cxa_begin_catch и __cxa_end_catch

После изучения того, как исключения выбрасываются, мы оказались на пути изучения, как они отлавливаются. В предыдущей главе мы добавили в наш пример приложения try-catch-блок, чтобы увидеть что делает компилятор, а так же получили ошибки линкера прямо как в прошлый раз, когда мы смотрели, что произойдет если добавить throw-блок. Вот что пишет линкер:

Напомню, что код вы можете получить на моем гит-репозитории.

В теории (в нашей теории, разумеется), catch-блок транслируется в пару __cxa_begin_catch/end_catch из libstdc++, но и во что-то новое, называемое персональной функцией, о который мы пока еще ничего не знаем.

Давайте проверим нашу теорию о __cxa_begin_catch и __cxa_end_catch. Скомпилируем throw. cpp с флагом — S и проанализируем код ассемблера. Там есть много чего интересного, урежем до самого необходимого:

Все идет замечательно: мы получили такое же определение для raise(), лишь выброс исключения:

Определение для try_but_dont_catch() обрезано компилятором. Это что-то новое: ссылка на __gxx_personality_v0 и что-то другое, называемое LSDA. Это выглядит незначительным определением, однако в действительности это очень важно:

  • линкер использует это для спецификации CFI (call frame information); CFI хранит информацию о фрейме вызова, вот его полная спецификация. Он используется, в основном, для раскручивания стэка.
  • LDSA (language specific data area) — специальная область для каждого языка, используемая персональной функцией, чтобы знать, какие исключения могут быть обработаны данной функцией.

Еще одна элементарщина: просто вызываем raise и после этого прыгаем на L8; L8 делает обычный возврат из функции. Если raise выполнится неправильно, тогда выполнение (как-то, мы пока еще не знаем, как!) должно не продолжаться на следующей инструкции, а перейти к обработчику исключению (который в терминах ABI называется landing pads , об этом позже).

На первый взгляд этот кусок немного сложен, однако в действительности все просто. Наибольшее количество магии происходит тут: сначала мы проверяем — можем ли мы обрабатывать это исключение, если нет — вызываем _Unwind_Resume , если можем — вызываем __cxa_begin_catch и __cxa_end_catch , после этого функция должна продолжиться нормально и, таким образом, L8 будет выполнено (L8 прямо под нашим catch-блоком):

Лишь обычный возврат функции… с некоторым мусором CFI в нем.

Это все для обработки ошибок, тем не менее, мы до сих пор не знаем, как работают __cxa_begin/end_catch; у нас есть идеи как эта пара формирует то, что называет landing pad — место в функции, где располагаются обраотчики исключений. Что мы пока не знаем — как landing pads ищутся. Unwind должен как-то пройти все вызовы в стеке, проверить: имеет ли какой-либо вызов (фрейм стека для точности) валидный блок с landing pad, который может обрабатывать это исключение, и продолжить выполнение в нем.

Это немаловажное достижение, и как это работает мы выясним в следующей главе.

C++ exceptions под капотом: gcc_except_table и персональная функция

Ранее мы выяснили, что throw транслируется в пару __cxa_allocate_exception/throw, а catch-блок транслируется в __cxa_begin/end_catch, а также во что-то, именуемое CFI (call frame information) для поиска landing pads — точки входа обработчиков ошибок.

Что мы не знаем до сих пор, это как _Unwind узнает, где этот landing pads. Когда исключение пробрасывается сквозь связку функций в стэке, все CFI позволяют программе разворачивания стэка узнать, что за функция сейчас исполняется, а так же это необходимо, чтобы узнать, какой из landing pads функции позволяет нам обрабатывать данное исключение (и, к слову, мы игнорируем функции с множественными try/catch блоками!).

Чтобы выяснить, где же этот landing pads находится, используется что-то, зовущее себя gcc_except_table. Таблица эта может быть найдена (с мусором CFI) после конца функции:

Эта секция .gcc_except_table — где хранится вся информация для обнаружения landing pads, мы поговорим об этом позже, когда будем анализировать персональную функцию. Пока что мы лишь скажем, что LSDA означает — зона с специфичными для языка данными, которые персональная функция проверяет на наличие landing pads для функции (она также используется для запуска деструкторов в процессе разворачивания стэка).

Подытожим: для каждой функции, где есть по крайней мере один catch-блок, компилятор транслирует его в пару вызовов cxa_begin_catch/cxa_end_catch и, затем, персональная функция, вызываемая __cxa_throw, читает gcc_except_table для каждого метода в стэке для поиска чего-то, называемого LSDA. Персональная функция затем проверяет, есть ли в LSDA блок, обрабатывающий данное исключение, а так же есть ли какой-то код очистки (который запускает деструкторы когда нужно).

Еще мы можем сделать интересный вывод: если мы используем nothrow (или пустой оператор throw), компилятор может опустить gcc_except_table для метода. Этот способ реализации исключений в gcc, не сильно влияющий на производительность, в действительности сильно влияет на размер кода. Что касается catch-блоков? Если исключение пробрасывается, когда объявлен спецификатор nothrow, LSDA не генерируется и персональная функция не знает, что ей делать. Когда персональная функция не знает, что ей делать, она вызывает обработчик ошибок по-умолчанию, что, в большинстве случаев, означает, что выброс ошибки из nothrow метода закончится std::terminate.

Теперь, когда у нас есть идеи, что делает персональная функция, сможем ли мы реализовать её? Что ж, посмотрим!

Сначала давайте посмотрим на следующий иллюстративный пример:

В этом примере есть часть кода c ошибкой, которая получается из-за деления на 0. Деление на 0 вызывает исключение: DivideByZeroException

  • Программа выполняется как обычно СЃ этапа (1), (2) РґРѕ (5).
  • РќР° этапе (6) появляется проблема РїСЂРё делении РЅР° 0.
  • Программа выскочила РёР· функции main, Рё строка РєРѕРґР° (7) РЅРµ будет выполнена.

Мы будем модифицировать код примера выше:

  • Шаги (1) — (6) являются полностью нормальными.
  • Исключение РїСЂРѕРёСЃС…РѕРґРёС‚ РЅР° этапе (7), проблема РїСЂРё делении РЅР° 0.
  • Сразу же после звпрыгивает для выполнения команды РІ блоке catch, шаг (8) пропущен.
  • Шаги (9), (10) выполнены.
  • Шаги(11), (12) выполнены.

2- Иерархия исключений

Exception

Основной класс всех исключений.

SystemException

Основной класс всех исключений генерированных во время запуска программы.

IndexOutOfRangeException

Выбрасывается во время запуска при доступе в элемент массива с неправильным индексом.

NullReferenceException

Выбрасывается во время запуска при ссылке на объект null.

AccessViolationException

Выбрасывается во время запуска при ссылке к недействительной памяти.

InvalidOperationException

Выбрасывается методом при недействительном статусе.

ArgumentException

Основной класс всех исключений связанных с аргументом (Argument).

ArgumentNullException

Это подкласс ArgumentException, который выбрасывается методом, не позволяющим передачу аргументов null.

ArgumentOutOfRangeException

Это подкласс ArgumentException, который выбрасывается методом когда аргумент не соответствует рамке позволяющей передачу.

ExternalException

Основной класс для исключений или пришедших из внешней среды.

COMException

Класс расширенный из ExternalException, исключение упаковывает информацию COM.

SEHException

Класс расширенный из ExternalException, ловил все исключения из Win32.

3- Поймать исключения используя try-catch

4- Блок try-catch-finally

5- Обернуть Exception в другом Exception

  • Person: Имитирует человека подающего заявление РЅР° работу РІ компанию СЃ информацией:
    • Имя, возраст, РїРѕР».
    • Стандартный возраст РѕС‚ 18 РґРѕ 40 лет
    • И мужчины.

    6- Распространенные исключения

    6.1- NullReferenceException

    На самом деле, подобно обработке других исключений, вы можете использовать try-catch, чтобы поймать и обработать это исключение. Тем не менее, это механически, как правило, мы должны проверить, чтобы значение объекта не было null до его использования.

    Вы можете исправить приведенный выше код как приведено ниже, избегая NullReferenceException:

    Источники:

    https://m. habr. com/ru/post/279111/

    https://betacode. net/10445/csharp-exception-handling

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: