linux-insides/Booting/linux-bootstrap-1.md

Процесс загрузки ядра. Часть 1.
================================================================================

От загрузчика к ядру
--------------------------------------------------------------------------------

Если вы читали предыдущие [статьи](http://0xax.blogspot.com/search/label/asm) моего блога, то могли заметить, что некоторое время назад я начал увлекаться низкоуровневым программированием. Я написал несколько статей о программировании под x86_64 в Linux. В то же время я начал "погружаться" в исходный код Linux. Я имею большой интерес к пониманию того, как работают низкоуровневые вещи, как запускаются программы на моем компьютере, как они расположены в памяти, как ядро управляет процессами и памятью, как работает сетевой стек на низком уровне и многие другие вещи. Поэтому я решил написать ещё одну серию статей о ядре Linux для **x86_64**.

Замечу, что я не профессиональный хакер ядра и не пишу под него код на работе. Это просто хобби. Мне просто нравятся низкоуровневые вещи и мне интересно наблюдать за тем, как они работают. Так что, если вас что-то будет смущать или у вас появятся вопросы или замечания, пишите мне в твиттер [0xAX](https://twitter.com/0xAX), присылайте письма на [email](anotherworldofworld@gmail.com) или просто создавайте [issue](https://github.com/0xAX/linux-insides/issues/new). Я ценю это. Все статьи также будут доступны на странице [linux-insides](https://github.com/0xAX/linux-insides), и, если вы обнаружите какую-нибудь ошибку в моём английском или в содержимом статьи, присылайте pull request.

*Заметьте, что это не официальная документация, а просто материал для обучения и обмена знаниями.*

**Требуемые знания**

* Понимание кода на языке C
* Понимание кода на языке ассемблера (AT&T синтаксис)

В любом случае, если вы только начинаете изучать некоторые инструменты, я постараюсь объяснить некоторые детали этой и последующих частей. Ладно, простое введение закончилось, и теперь можно начать "погружение" в ядро и низкоуровневые вещи.

Весь код, представленный здесь, в основном для ядра версии 3.18. Если есть какие-то изменения, позже я обновлю статьи соответствующим образом.

Магическая кнопка включения, что происходит дальше?
--------------------------------------------------------------------------------

Несмотря на то, что это серия статей о ядре Linux, мы не будем начинать с его исходного кода (по крайней мере в этом параграфе). Как только вы нажмёте магическую кнопку включения на вашем ноутбуке или настольном компьютере, он начинает работать. Материнская плата посылает сигнал к [источнику питания](https://en.wikipedia.org/wiki/Power_supply). После получения сигнала, источник питания обеспечивает компьютер надлежащим количеством электричества. После того как материнская плата получает сигнал ["питание в норме" (Power good signal)](https://en.wikipedia.org/wiki/Power_good_signal), она пытается запустить ЦПУ. ЦПУ сбрасывает все остаточные данные в регистрах и записывает предустановленные значения каждого из них.

ЦПУ серии [Intel 80386](https://en.wikipedia.org/wiki/Intel_80386) и старше после перезапуска компьютера заполняют регистры следующими предустановленными значениями:

```
IP          0xfff0
CS selector 0xf000
CS base     0xffff0000
```
Процессор начинает свою работу в [режиме реальных адресов](https://en.wikipedia.org/wiki/Real_mode). Давайте немного задержимся и попытаемся понять сегментацию памяти в этом режиме. Режим реальных адресов поддерживается всеми x86-совместимыми процессорами, от [8086](https://en.wikipedia.org/wiki/Intel_8086) до самых новых 64-битных ЦПУ Intel. Процессор 8086 имел 20-битную шину адреса, т.е. он мог работать с адресным пространством в диапазоне 0-0xFFFFF (1 мегабайт). Но регистры у него были только 16-битные, а в таком случае максимальный размер адресуемой памяти составляет `2^16 - 1` или `0xffff` (64 килобайта). [Сегментация памяти](http://en.wikipedia.org/wiki/Memory_segmentation) используется для того, чтобы задействовать всё доступное адресное пространство. Вся память делится на небольшие, фиксированного размера сегменты по 65536 байт (64 Кб). Поскольку мы не можем адресовать память свыше 64 Кб с помощью 16-битных регистров, был придуман альтернативный метод. Адрес состоит из двух частей: селектора сегмента, который содержит базовый адрес, и смещение от этого базового адреса. В режиме реальных адресов базовый адрес селектора сегмента это `Селектор Сегмента * 16`. Таким образом, чтобы получить физический адрес в памяти, нужно умножить селектор сегмента на 16 и прибавить смещение:

```
Физический адрес = Селектор сегмента * 16 + Смещение
```

Например, если `CS:IP` содержит `0x2000:0x0010`, то соответствующий физический адрес будет:

```python
>>> hex((0x2000 << 4) + 0x0010)
'0x20010'
```

Но если мы возьмём максимально доступный селектор сегментов и смещение: `0xffff:0xffff`, то итоговый адрес будет:

```python
>>> hex((0xffff << 4) + 0xffff)
'0x10ffef'
```

что больше первого мегабайта на 65520 байт. Поскольку в режиме реальных адресов доступен только один мегабайт, с отключённой [адресной линией A20](https://en.wikipedia.org/wiki/A20_line) `0x10ffef` становится `0x00ffef`.

Хорошо, теперь мы знаем о режиме реальных адресов и адресации памяти. Давайте вернёмся к обсуждению значений регистров после сброса.

Регистр `CS` состоит из двух частей: видимый селектор сегмента и скрытый базовый адрес.
В то время как базовый адрес, как правило, формируется путём умножения значения селектора сегмента на 16, во время аппаратного перезапуска в селектор сегмента в регистре `CS` записывается `0xf000`, а в базовый адрес - `0xffff0000`. Процессор использует этот специальный базовый адрес, пока регистр `CS` не изменится.

Начальный адрес формируется путём добавления базового адреса к значению в регистре `EIP`:

```python
>>> 0xffff0000 + 0xfff0
'0xfffffff0'
```

Мы получили `0xfffffff0`, т.е. 16 байт ниже 4 Гб. По этому адресу располагается так называемый [вектор прерываний](http://en.wikipedia.org/wiki/Reset_vector). Это область памяти, в которой ЦПУ ожидает найти первую инструкцию для выполнения после сброса. Она содержит инструкцию [jump](http://en.wikipedia.org/wiki/JMP_%28x86_instruction%29) (`jmp`), которая обычно указывает на точку входа в BIOS. Например, если мы взглянем на исходный код [coreboot](http://www.coreboot.org/), то увидим следующее:

```assembly
    .section ".reset"
    .code16
.globl  reset_vector
reset_vector:
    .byte  0xe9
    .int   _start - ( . + 2 )
    ...
```

Здесь мы можем видеть [опкод инструкции jmp](http://ref.x86asm.net/coder32.html#xE9) - `0xe9`, и его адрес назначения `_start - ( . + 2)`. Мы также можем видеть, что секция `reset` занимает 16 байт и начинается с `0xfffffff0`:

```
SECTIONS {
    _ROMTOP = 0xfffffff0;
    . = _ROMTOP;
    .reset . : {
        *(.reset)
        . = 15 ;
        BYTE(0x00);
    }
}
```

Теперь запускается BIOS; после инициализации и проверки оборудования, BIOS нужно найти загрузочное устройство. Порядок загрузки хранится в конфигурации BIOS, которая определяет, с каких устройств BIOS пытается загрузиться. При попытке загрузиться с жёсткого диска, BIOS пытается найти загрузочный сектор. На размеченных жёстких дисках со схемой разделов MBR, загрузочный сектор расположен в первых 446 байтах первого сектора, размер которого 512 байт. Последние два байта первого сектора - `0x55` и `0xaa`, которые оповещают BIOS о том, что устройство является загрузочным. Например:

```assembly
;
; Замечание: этот пример написан с использованием Intel синтаксиса
;
[BITS 16]
[ORG  0x7c00]

boot:
    mov al, '!'
    mov ah, 0x0e
    mov bh, 0x00
    mov bl, 0x07

    int 0x10
    jmp $

times 510-($-$$) db 0

db 0x55
db 0xaa
```

Собрать и запустить этот код можно таким образом:

```
nasm -f bin boot.nasm && qemu-system-x86_64 boot
```

Команда оповещает эмулятор [QEMU](http://qemu.org) о необходимости использовать в качестве образа диска созданный только что бинарный файл. Пока последний проверяет, удовлетворяет ли загрузочный сектор всем необходимым требованиям (в origin записывается `0x7c00`, а в конце магическая последовательность), QEMU будет работать с бинарным файлом как с главной загрузочной записью (MBR) образа диска.

Вы увидите:

![Простой загрузчик, который печатает только `!`](http://oi60.tinypic.com/2qbwup0.jpg)

В этом примере мы можем видеть, что код будет выполнен в 16-битном режиме реальных адресов и начнёт выполнение с адреса `0x7c00`. После запуска он вызывает прерывание [0x10](http://www.ctyme.com/intr/rb-0106.htm), которое просто печатает символ `!`. Оставшиеся 510 байт заполняются нулями, и код заканчивается двумя магическими байтами `0xaa` и `0x55`.

Вы можете увидеть бинарный дамп с помощью утилиты `objdump`:

```
nasm -f bin boot.nasm
objdump -D -b binary -mi386 -Maddr16,data16,intel boot
```

Реальный загрузочный сектор имеет код для продолжения процесса загрузки и таблицу разделов вместо кучи нулей и восклицательного знака :) С этого момента BIOS передаёт управление загрузчику.

**ЗАМЕЧАНИЕ**: Как уже было упомянуто ранее, ЦПУ находится в режиме реальных адресов; в этом режиме вычисление физического адреса в памяти выполняется следующим образом:

```
Физический адрес = Селектор сегмента * 16 + Смещение
```
так же, как было упомянуто выше. У нас есть только 16-битные регистры общего назначения; максимальное значение 16-битного регистра - `0xffff`. Поэтому, если мы возьмём максимальное возможное значение, то результат будет следующий:

```python
>>> hex((0xffff * 16) + 0xffff)
'0x10ffef'
```

где `0x10ffef` равен `1 Мб + 64 Кб - 16 байт`. Процессор [8086](https://en.wikipedia.org/wiki/Intel_8086) (который был первым процессором с режимом реальных адресов), в отличии от этого, имеет 20 битную шину адресации. Поскольку `2^20 = 1048576` это 1 Мб, получается, что фактический объём доступной памяти составляет 1 Мб.

Основная карта разделов в режиме реальных адресов выглядит следующим образом:

```
0x00000000 - 0x000003FF - Таблица векторов прерываний
0x00000400 - 0x000004FF - Данные BIOS
0x00000500 - 0x00007BFF - Не используется
0x00007C00 - 0x00007DFF - Наш загрузчик
0x00007E00 - 0x0009FFFF - Не используется
0x000A0000 - 0x000BFFFF - RAM (VRAM) видеопамять
0x000B0000 - 0x000B7777 - Память для монохромного видео
0x000B8000 - 0x000BFFFF - Память для цветного видео
0x000C0000 - 0x000C7FFF - BIOS ROM видеопамяти
0x000C8000 - 0x000EFFFF - Скрытая область BIOS
0x000F0000 - 0x000FFFFF - Системная BIOS
```

В начале статьи я написал, что первая инструкция, выполняемая ЦПУ, расположена по адресу `0xFFFFFFF0`, значение которого намного больше, чем `0xFFFFF` (1 Мб). Каким образом ЦПУ получает доступ к этому участку в режиме реальных адресов? Ответ на этот вопрос находится в документации [coreboot](http://www.coreboot.org/Developer_Manual/Memory_map):

```
0xFFFE_0000 - 0xFFFF_FFFF: 128 Кб ROM отображаются на адресное пространство
```
В начале выполнения BIOS находится не в RAM, а в ROM.

Загрузчик
--------------------------------------------------------------------------------

Существует несколько загрузчиков Linux, такие как [GRUB 2](https://www.gnu.org/software/grub/) и [syslinux](http://www.syslinux.org/wiki/index.php/The_Syslinux_Project). Ядро Linux имеет [протокол загрузки](https://github.com/torvalds/linux/blob/master/Documentation/x86/boot.txt), который определяет требования к загрузчику для реализации поддержки Linux. В этом примере будет описан GRUB 2.

Теперь, когда BIOS выбрал загрузочное устройство и передал контроль управления коду в загрузочном секторе, начинается выполнение [boot.img](http://git.savannah.gnu.org/gitweb/?p=grub.git;a=blob;f=grub-core/boot/i386/pc/boot.S;hb=HEAD). Этот код очень простой в связи с ограниченным количеством свободного пространства и содержит указатель, который используется для перехода к основному образу GRUB 2. Основной образ начинается с [diskboot.img](http://git.savannah.gnu.org/gitweb/?p=grub.git;a=blob;f=grub-core/boot/i386/pc/diskboot.S;hb=HEAD), который обычно располагается сразу после первого сектора в неиспользуемой области перед первым разделом. Приведённый выше код загружает оставшуюся часть основного образа, который содержит ядро и драйверы GRUB 2 для управления файловой системой. После загрузки остальной части основного образа, код выполняет [grub_main](http://git.savannah.gnu.org/gitweb/?p=grub.git;a=blob;f=grub-core/kern/main.c).

`grub_main` инициализирует консоль, получает базовый адрес для модулей, устанавливает корневое устройство, загружает/обрабатывает файл настроек grub, загружает модули и т.д. В конце выполнения, `grub_main` переводит grub обратно в нормальный режим. `grub_normal_execute` (из `grub-core/normal/main.c`) завершает последние приготовления и отображает меню выбора операционной системы. Когда мы выбираем один из пунктов меню, запускается `grub_menu_execute_entry`, который в свою очередь запускает команду grub `boot`, загружающую выбранную операционную систему.

Из протокола загрузки видно, что загрузчик должен читать и заполнять некоторые поля в заголовке ядра, который начинается со смещения `0x01f1` в коде настроек. Вы можете посмотреть загрузочный [скрипт компоновщика](https://github.com/torvalds/linux/blob/master/arch/x86/boot/setup.ld#L16), чтобы убедиться в этом. Заголовок ядра [arch/x86/boot/header.S](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S) начинается с:

```assembly
    .globl hdr
hdr:
    setup_sects: .byte 0
    root_flags:  .word ROOT_RDONLY
    syssize:     .long 0
    ram_size:    .word 0
    vid_mode:    .word SVGA_MODE
    root_dev:    .word 0
    boot_flag:   .word 0xAA55
```

Загрузчик должен заполнить этот и другие заголовки (которые помеченные как тип `write` в протоколе загрузки Linux, например, в [данном примере](https://github.com/torvalds/linux/blob/master/Documentation/x86/boot.txt#L354)) значениями, которые он получил из командной строки или вычисленными значениями. (Мы не будет вдаваться в подробности и описывать все поля заголовка ядра, но, когда он будет их использовать, вернёмся к этому; тем не менее вы можете найти полное описание всех полей в [протоколе загрузки](https://github.com/torvalds/linux/blob/master/Documentation/x86/boot.txt#L156).)

Как мы видим из протокола, после загрузки ядра карта распределения памяти будет выглядеть следующим образом:

```shell
         | Ядро защищённого режима  |
100000   +--------------------------+
         | Память I/O               |
0A0000   +--------------------------+
         | Резерв для BIOS          | Оставлен максимально допустимый размер
         ~                          ~
         | Командная строка         | (Может быть ниже X+10000)
X+10000  +--------------------------+
         | Стек/куча                | Используется кодом ядра в режиме реальных адресов
X+08000  +--------------------------+
         | Настройки ядра           | Код ядра режима реальных адресов.
         | Загрузочный сектор ядра  | Унаследованный загрузочный сектор ядра.
       X +--------------------------+
         | Загрузчик                | <- Точка входа загрузочного сектора 0x7C00
001000   +--------------------------+
         | Резерв для MBR/BIOS      |
000800   +--------------------------+
         | Обычно используется MBR  |
000600   +--------------------------+
         | Используется только BIOS |
000000   +--------------------------+

```

Итак, когда загрузчик передаёт управление ядру, он запускается с:

```
X + sizeof(KernelBootSector) + 1
```
где `X` -  это адрес загруженного сектора загрузки ядра. В моем случае `X` это `0x10000`, как мы можем видеть в дампе памяти:

![Первый адрес ядра](http://oi57.tinypic.com/16bkco2.jpg)

Сейчас загрузчик поместил ядро Linux в память, заполнил поля заголовка, а затем переключился на него. Теперь мы можем перейти непосредственно к коду настройки ядра.

Запуск настройки ядра
--------------------------------------------------------------------------------
Наконец-то, мы находимся в ядре! Технически, ядро ещё не работает; во-первых, нам нужно настроить ядро, менеджер памяти, менеджер процессов и т.д. Настройка ядра начинается в [arch/x86/boot/header.S](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S), начиная со [_start](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L293). Это немного странно на первый взгляд, так как перед этим есть ещё несколько инструкций.

Давным-давно у Linux был свой загрузчик, но сейчас, если вы запустите, например:

```
qemu-system-x86_64 vmlinuz-3.18-generic
```

то увидите:

![Попытка использовать vmlinuz в qemu](http://oi60.tinypic.com/r02xkz.jpg)

На самом деле, `header.S`  начинается с [MZ](https://en.wikipedia.org/wiki/DOS_MZ_executable) (см. картинку выше), вывода сообщения об ошибке и [PE](https://en.wikipedia.org/wiki/Portable_Executable) заголовка:

```assembly
#ifdef CONFIG_EFI_STUB
# "MZ", MS-DOS header
.byte 0x4d
.byte 0x5a
#endif
...
...
...
pe_header:
    .ascii "PE"
    .word 0
```

Это нужно, чтобы загрузить операционную систему с [UEFI](https://en.wikipedia.org/wiki/Unified_Extensible_Firmware_Interface). Мы не будем смотреть на его внутреннюю работу прямо сейчас; это будет в одной из следующих глав.

Настоящая настройка ядра начинается с:

```assembly
// header.S строка 292
.globl _start
_start:
```

Загрузчик (grub2 или другой) знает об этой метке (смещение `0x200` от `MZ`) и сразу переходит на неё, несмотря на то, что `header.S` начинается с секции `.bstext`, которая выводит сообщение об ошибке:

```
//
// arch/x86/boot/setup.ld
//
. = 0;                    // текущая позиция
.bstext : { *(.bstext) }  // поместить секцию .bstext в позицию 0
.bsdata : { *(.bsdata) }
```

Точка входа настройки ядра:

```assembly
    .globl _start
_start:
    .byte  0xeb
    .byte  start_of_setup-1f
1:
    //
    // остальная часть заголовка
    //
```

Здесь мы можем видеть опкод инструкции `jmp` (`0xeb`) к метке `start_of_setup-1f`. Нотация `Nf` означает, что `2f` ссылается на следующую локальную метку `2:`; в нашем случае это метка `1`, которая расположена сразу после инструкции jump и содержит оставшуюся часть [заголовка](https://github.com/torvalds/linux/blob/master/Documentation/x86/boot.txt#L156). Сразу после заголовка настроек мы видим секцию .entrytext, которая начинается с метки `start_of_setup`.

Это первый код, который на самом деле запускается (отдельно от предыдущей инструкции jump, конечно). После того, как настройщик ядра получил управление от загрузчика, первая инструкция `jmp` располагалась в смещении `0x200` от начала реальных адресов, т.е после первых 512 байт. Об этом можно узнать из протокола загрузки ядра Linux, а также увидеть в исходном коде grub2:

```C
segment = grub_linux_real_target >> 4;
state.gs = state.fs = state.es = state.ds = state.ss = segment;
state.cs = segment + 0x20;
```

Это означает, что после начала настройки ядра регистры сегмента будут иметь следующие значения:

```
gs = fs = es = ds = ss = 0x1000
cs = 0x1020
```


В моём случае, ядро загружается в `0x10000`.

После перехода на метку `start_of_setup`, необходимо соблюсти следующие условия:

* Убедиться, что все значения всех сегментных регистров равны
* Правильно настроить стек, если это необходимо
* Настроить [BSS](https://en.wikipedia.org/wiki/.bss)
* Перейти к C-коду в [main.c](https://github.com/torvalds/linux/blob/master/arch/x86/boot/main.c)

Давайте посмотрим, как эти условия выполняются.

Выравнивание сегментных регистров
--------------------------------------------------------------------------------

Прежде всего, ядро гарантирует, что сегментные регистры `ds` и `es` указывают на один и тот же адрес. Затем оно сбрасывает флаг направления с помощью инструкции `cld`:

```assembly
    movw    %ds, %ax
    movw    %ax, %es
    cld
```

Как я уже писал ранее, grub2 загружает код настройки ядра по адресу `0x10000` и `cs` по адресу `0x1020`, потому что исполнение не начинается с начала файла, а с

```assembly
_start:
    .byte 0xeb
    .byte start_of_setup-1f
```
инструкции `jump`, расположение которой смещено на 512 байт от [4d 5a](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L47). Также необходимо выровнять `cs` с `0x10200` на `0x10000`, а также остальные сегментные регистры. После этого мы настраиваем стек:

```assembly
    pushw   %ds
    pushw   $6f
    lretw
```

кладём значение `ds` на стек по адресу метки [6](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L494) и выполняем инструкцию `lretw`. Когда мы вызываем `lretw`, она загружает адрес метки `6` в регистр [счётчика команд (IP)](https://en.wikipedia.org/wiki/Program_counter), и загружает `cs` со значением `ds`. После этого `ds` и `cs` будут иметь одинаковые значения.

Настройка стека
--------------------------------------------------------------------------------

Почти весь код настройки - это подготовка для среды языка C в режиме реальных адресов. Следующим [шагом](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L467) является проверка значения регистра `ss` и создании правильного стека, если значение `ss` неверно:

```assembly
    movw    %ss, %dx
    cmpw    %ax, %dx
    movw    %sp, %dx
    je      2f
```

Это может привести к трём различны сценариям:

* `ss` имеет верное значение `0x10000` (как и все остальные сегментные регистры рядом с `cs`)
* `ss` является некорректным и установлен флаг `CAN_USE_HEAP` (см. ниже)
* `ss` является некорректным и флаг `CAN_USE_HEAP` не установлен (см. ниже)

Давайте рассмотрим все три сценария:

* `ss` имеет верный адрес (`0x10000`). В этом случае мы переходим на метку [2](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L481):

```assembly
2:  andw    $~3, %dx
    jnz     3f
    movw    $0xfffc, %dx
3:  movw    %ax, %ss
    movzwl  %dx, %esp
    sti
```


Здесь мы видим выравнивание сегмента `dx` (содержащего значение `sp`, полученное загрузчиком) 4 байтами и проверку - является ли полученное значение нулём. Если ноль, то помещаем `0xfffx` (выровненный 4 байтами адрес до максимального значения сегмента за вычетом 64 Кб) в `dx`. Если не ноль, продолжаем использовать `sp`, полученный от загрузчика (в моём случае 0xf7f4). После этого мы помещаем значение `ax` в `ss`, который хранит правильный адрес сегмента `0x10000` и устанавливает правильное значение `sp`. Теперь мы имеем правильный стек:

![стек](http://oi58.tinypic.com/16iwcis.jpg)

* Второй сценарий (когда `ss` != `ds`). Во-первых, поместим значение [_end](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L481) (адрес окончания кода настройки) в `dx` и проверим поле заголовка `loadflags` инструкцией `testb`, чтобы проверить, можем ли мы использовать кучу (heap). [loadflags](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L321) является заголовком с битовой маской, который определяется как:

```C
#define LOADED_HIGH     (1<<0)
#define QUIET_FLAG      (1<<5)
#define KEEP_SEGMENTS   (1<<6)
#define CAN_USE_HEAP    (1<<7)
```

и, как мы можем узнать из протокола загрузки:

```
Field name: loadflags

  This field is a bitmask.

  Bit 7 (write): CAN_USE_HEAP
    Set this bit to 1 to indicate that the value entered in the
    heap_end_ptr is valid.  If this field is clear, some setup code
    functionality will be disabled.
```
Если бит `CAN_USE_HEAP` установлен, мы помещаем `heap_end_ptr` в `dx` (который указывает на `_end`) и добавляем к нему `STACK_SIZE` (минимальный размер стека, 512 байт). После этого, если `dx` без переноса (так и будет, dx = _end + 512), переходим на метку `2` (как в предыдущем случае) и создаём правильный стек.

![стек](http://oi62.tinypic.com/dr7b5w.jpg)

* Когда флаг `CAN_USE_HEAP` не установлен, мы просто используем минимальный стек от `_end` до `_end + STACK_SIZE`:

![минимальный стек](http://oi60.tinypic.com/28w051y.jpg)

Настройка BSS
--------------------------------------------------------------------------------

Последние два шага, которые нужно выполнить перед тем, как мы сможем перейти к основному C-коду, это настройка [BSS](https://en.wikipedia.org/wiki/.bss)  и проверка "магических" сигнатур. Сначала проверка сигнатур:

```assembly
    cmpl    $0x5a5aaa55, setup_sig
    jne     setup_bad
```
Это просто сравнение [setup_sig](https://github.com/torvalds/linux/blob/master/arch/x86/boot/setup.ld#L39) с магическим числом `0x5a5aaa55`. Если они не равны, возникает фатальная ошибка.

Если магические числа совпадают, зная, что у нас есть набор правильно настроенных сегментных регистров и стек, нам всего лишь нужно настроить BSS, прежде чем перейти к C-коду.

Секция BSS используется для хранения статически выделенных, неинициализированных данных. Linux тщательно обнуляет эту область памяти, используя следующий код:

```assembly
    movw    $__bss_start, %di
    movw    $_end+3, %cx
    xorl    %eax, %eax
    subw    %di, %cx
    shrw    $2, %cx
    rep; stosl
```
Во-первых, адрес [__bss_start](https://github.com/torvalds/linux/blob/master/arch/x86/boot/setup.ld#L47) помещается в `di`. Далее, адрес `_end + 3` (+3 - выравнивает до 4 байт) помещается в `cx`. Регистр `eax` очищается (с помощью инструкции `xor`), а размер секции BSS (`cx`-`di`) вычисляется и помещается в `cx`. Затем `cx` делится на 4 (размер 'слова' (англ. word)), а инструкция `stosl` используется повторно, сохраняя значение `eax` (ноль) в адрес, на который указывает `di`, автоматически увеличивая `di` на 4 (это продолжается до тех пор, пока `cx` не достигнет нуля). Эффект от этого кода в том, что теперь все 'слова' в памяти от `__bss_start` до `_end` заполнены нулями:

![bss](http://oi59.tinypic.com/29m2eyr.jpg)

Переход к основному коду
--------------------------------------------------------------------------------

Вот и все, теперь у нас есть стек и BSS, поэтому мы можем перейти к C-функции `main()`:

```assembly
    calll main
```

Функция `main()` находится в файле [arch/x86/boot/main.c](https://github.com/torvalds/linux/blob/master/arch/x86/boot/main.c). О том, что она делает, вы сможете узнать в следующей части.

Заключение
--------------------------------------------------------------------------------

Это конец первой части о внутренностях ядра Linux. В следующей части мы увидим первый код на языке C, который выполняется при настройке ядра Linux, реализацию процедур для работы с памятью, таких как `memset`, `memcpy`, `earlyprintk`, инициализацию консоли и многое другое.

**Пожалуйста, имейте в виду, что английский - не мой родной язык, и я очень извиняюсь за возможные неудобства. Если вы найдёте какие-либо ошибки или неточности в переводе, пожалуйста, пришлите pull request в [linux-insides-ru](https://github.com/proninyaroslav/linux-insides-ru).**

Ссылки
--------------------------------------------------------------------------------

  * [Справочник программиста Intel 80386 1986](http://css.csail.mit.edu/6.858/2014/readings/i386.pdf)
  * [Минимальный загрузчик для архитектуры Intel®](https://www.cs.cmu.edu/~410/doc/minimal_boot.pdf)
  * [8086](http://en.wikipedia.org/wiki/Intel_8086)
  * [80386](http://en.wikipedia.org/wiki/Intel_80386)
  * [Вектор прерываний](http://en.wikipedia.org/wiki/Reset_vector)
  * [Режим реальных адресов](http://en.wikipedia.org/wiki/Real_mode)
  * [Протокол загрузки ядра Linux](https://www.kernel.org/doc/Documentation/x86/boot.txt)
  * [Справочник разработчика CoreBoot](http://www.coreboot.org/Developer_Manual)
  * [Список прерываний Ральфа Брауна](http://www.ctyme.com/intr/int.htm)
  * [Источник питания](http://en.wikipedia.org/wiki/Power_supply)
  * [Сигнал "Питание в норме"](http://en.wikipedia.org/wiki/Power_good_signal)
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Процесс загрузки ядра. Часть 1.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								================================================================================
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								От загрузчика к ядру
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								--------------------------------------------------------------------------------
-												Перевод linux-bootstrap-2.md, LINKS.md, CONTRIBUTING.md, исправление ошибок

											
										
										
											2016-12-29 10:50:38 +00:00
+								Если вы читали предыдущие [статьи](http://0xax.blogspot.com/search/label/asm) моего блога, то могли заметить, что некоторое время назад я начал увлекаться низкоуровневым программированием. Я написал несколько статей о программировании под x86_64 в Linux. В то же время я начал "погружаться" в исходный код Linux. Я имею большой интерес к пониманию того, как работают низкоуровневые вещи, как запускаются программы на моем компьютере, как они расположены в памяти, как ядро управляет процессами и памятью, как работает сетевой стек на низком уровне и многие другие вещи. Поэтому я решил написать ещё одну серию статей о ядре Linux для **x86_64**.
-												Updated first 2 paragraphs
											
										
										
											2015-01-03 20:31:14 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Замечу, что я не профессиональный хакер ядра и не пишу под него код на работе. Это просто хобби. Мне просто нравятся низкоуровневые вещи и мне интересно наблюдать за тем, как они работают. Так что, если вас что-то будет смущать или у вас появятся вопросы или замечания, пишите мне в твиттер [0xAX](https://twitter.com/0xAX), присылайте письма на [email](anotherworldofworld@gmail.com) или просто создавайте [issue](https://github.com/0xAX/linux-insides/issues/new). Я ценю это. Все статьи также будут доступны на странице [linux-insides](https://github.com/0xAX/linux-insides), и, если вы обнаружите какую-нибудь ошибку в моём английском или в содержимом статьи, присылайте pull request.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								*Заметьте, что это не официальная документация, а просто материал для обучения и обмена знаниями.*
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								**Требуемые знания**
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								* Понимание кода на языке C
 								* Понимание кода на языке ассемблера (AT&T синтаксис)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								В любом случае, если вы только начинаете изучать некоторые инструменты, я постараюсь объяснить некоторые детали этой и последующих частей. Ладно, простое введение закончилось, и теперь можно начать "погружение" в ядро и низкоуровневые вещи.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Весь код, представленный здесь, в основном для ядра версии 3.18. Если есть какие-то изменения, позже я обновлю статьи соответствующим образом.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Магическая кнопка включения, что происходит дальше?
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								--------------------------------------------------------------------------------
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Несмотря на то, что это серия статей о ядре Linux, мы не будем начинать с его исходного кода (по крайней мере в этом параграфе). Как только вы нажмёте магическую кнопку включения на вашем ноутбуке или настольном компьютере, он начинает работать. Материнская плата посылает сигнал к [источнику питания](https://en.wikipedia.org/wiki/Power_supply). После получения сигнала, источник питания обеспечивает компьютер надлежащим количеством электричества. После того как материнская плата получает сигнал ["питание в норме" (Power good signal)](https://en.wikipedia.org/wiki/Power_good_signal), она пытается запустить ЦПУ. ЦПУ сбрасывает все остаточные данные в регистрах и записывает предустановленные значения каждого из них.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								ЦПУ серии [Intel 80386](https://en.wikipedia.org/wiki/Intel_80386) и старше после перезапуска компьютера заполняют регистры следующими предустановленными значениями:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
 								IP          0xfff0
 								CS selector 0xf000
 								CS base     0xffff0000
 								```
-												Исправление форматирования констант

											
										
										
											2017-07-08 16:44:00 +00:00
+								Процессор начинает свою работу в [режиме реальных адресов](https://en.wikipedia.org/wiki/Real_mode). Давайте немного задержимся и попытаемся понять сегментацию памяти в этом режиме. Режим реальных адресов поддерживается всеми x86-совместимыми процессорами, от [8086](https://en.wikipedia.org/wiki/Intel_8086) до самых новых 64-битных ЦПУ Intel. Процессор 8086 имел 20-битную шину адреса, т.е. он мог работать с адресным пространством в диапазоне 0-0xFFFFF (1 мегабайт). Но регистры у него были только 16-битные, а в таком случае максимальный размер адресуемой памяти составляет `2^16 - 1` или `0xffff` (64 килобайта). [Сегментация памяти](http://en.wikipedia.org/wiki/Memory_segmentation) используется для того, чтобы задействовать всё доступное адресное пространство. Вся память делится на небольшие, фиксированного размера сегменты по 65536 байт (64 Кб). Поскольку мы не можем адресовать память свыше 64 Кб с помощью 16-битных регистров, был придуман альтернативный метод. Адрес состоит из двух частей: селектора сегмента, который содержит базовый адрес, и смещение от этого базового адреса. В режиме реальных адресов базовый адрес селектора сегмента это `Селектор Сегмента * 16`. Таким образом, чтобы получить физический адрес в памяти, нужно умножить селектор сегмента на 16 и прибавить смещение:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Физический адрес = Селектор сегмента * 16 + Смещение
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Например, если `CS:IP` содержит `0x2000:0x0010`, то соответствующий физический адрес будет:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```python
 								>>> hex((0x2000 << 4) + 0x0010)
 								'0x20010'
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Но если мы возьмём максимально доступный селектор сегментов и смещение: `0xffff:0xffff`, то итоговый адрес будет:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```python
 								>>> hex((0xffff << 4) + 0xffff)
 								'0x10ffef'
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								что больше первого мегабайта на 65520 байт. Поскольку в режиме реальных адресов доступен только один мегабайт, с отключённой [адресной линией A20](https://en.wikipedia.org/wiki/A20_line) `0x10ffef` становится `0x00ffef`.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Хорошо, теперь мы знаем о режиме реальных адресов и адресации памяти. Давайте вернёмся к обсуждению значений регистров после сброса.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Регистр `CS` состоит из двух частей: видимый селектор сегмента и скрытый базовый адрес.
-												Исправление форматирования констант

											
										
										
											2017-07-08 16:44:00 +00:00
+								В то время как базовый адрес, как правило, формируется путём умножения значения селектора сегмента на 16, во время аппаратного перезапуска в селектор сегмента в регистре `CS` записывается `0xf000`, а в базовый адрес - `0xffff0000`. Процессор использует этот специальный базовый адрес, пока регистр `CS` не изменится.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Начальный адрес формируется путём добавления базового адреса к значению в регистре `EIP`:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```python
-												Update linux-bootstrap-1.md
											
										
										
											2015-01-07 17:06:05 +00:00
+								>>> 0xffff0000 + 0xfff0
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								'0xfffffff0'
 								```
-												Перевод linux-bootstrap-5.md, корректировка переводов

											
										
										
											2017-04-26 09:00:12 +00:00
+								Мы получили `0xfffffff0`, т.е. 16 байт ниже 4 Гб. По этому адресу располагается так называемый [вектор прерываний](http://en.wikipedia.org/wiki/Reset_vector). Это область памяти, в которой ЦПУ ожидает найти первую инструкцию для выполнения после сброса. Она содержит инструкцию [jump](http://en.wikipedia.org/wiki/JMP_%28x86_instruction%29) (`jmp`), которая обычно указывает на точку входа в BIOS. Например, если мы взглянем на исходный код [coreboot](http://www.coreboot.org/), то увидим следующее:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    .section ".reset"
 								    .code16
 								.globl  reset_vector
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								reset_vector:
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    .byte  0xe9
 								    .int   _start - ( . + 2 )
 								    ...
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Исправление форматирования констант

											
										
										
											2017-07-08 16:44:00 +00:00
+								Здесь мы можем видеть [опкод инструкции jmp](http://ref.x86asm.net/coder32.html#xE9) - `0xe9`, и его адрес назначения `_start - ( . + 2)`. Мы также можем видеть, что секция `reset` занимает 16 байт и начинается с `0xfffffff0`:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
 								SECTIONS {
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    _ROMTOP = 0xfffffff0;
 								    . = _ROMTOP;
 								    .reset . : {
 								        *(.reset)
 								        . = 15 ;
 								        BYTE(0x00);
 								    }
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								}
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Теперь запускается BIOS; после инициализации и проверки оборудования, BIOS нужно найти загрузочное устройство. Порядок загрузки хранится в конфигурации BIOS, которая определяет, с каких устройств BIOS пытается загрузиться. При попытке загрузиться с жёсткого диска, BIOS пытается найти загрузочный сектор. На размеченных жёстких дисках со схемой разделов MBR, загрузочный сектор расположен в первых 446 байтах первого сектора, размер которого 512 байт. Последние два байта первого сектора - `0x55` и `0xaa`, которые оповещают BIOS о том, что устройство является загрузочным. Например:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
-												Intel syntax uses ; as a comment mark

There's a NASM compilation error:
```
boot.nasm:1: error: label or instruction expected at start of line
Note: this example written with Intel syntax:1: error: label or instruction expected at start of line
```
											
										
										
											2015-03-09 18:29:39 +00:00
+								;
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								; Замечание: этот пример написан с использованием Intel синтаксиса
-												Intel syntax uses ; as a comment mark

There's a NASM compilation error:
```
boot.nasm:1: error: label or instruction expected at start of line
Note: this example written with Intel syntax:1: error: label or instruction expected at start of line
```
											
										
										
											2015-03-09 18:29:39 +00:00
+								;
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								[BITS 16]
 								[ORG  0x7c00]
 								boot:
-												Updated bootloader example

											
										
										
											2015-01-04 17:05:22 +00:00
+								    mov al, '!'
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								    mov ah, 0x0e
 								    mov bh, 0x00
 								    mov bl, 0x07
-												fixed sample bootloader code

											
										
										
											2015-01-04 13:57:42 +00:00
+								    int 0x10
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								    jmp $
 								times 510-($-$$) db 0
-												Updated bootloader example

											
										
										
											2015-01-04 17:05:22 +00:00
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								db 0x55
-												Updated bootloader example

											
										
										
											2015-01-04 17:05:22 +00:00
+								db 0xaa
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Собрать и запустить этот код можно таким образом:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
 								nasm -f bin boot.nasm && qemu-system-x86_64 boot
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Команда оповещает эмулятор [QEMU](http://qemu.org) о необходимости использовать в качестве образа диска созданный только что бинарный файл. Пока последний проверяет, удовлетворяет ли загрузочный сектор всем необходимым требованиям (в origin записывается `0x7c00`, а в конце магическая последовательность), QEMU будет работать с бинарным файлом как с главной загрузочной записью (MBR) образа диска.
-												Add description on QEMU booting

											
										
										
											2015-02-28 12:23:52 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Вы увидите:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								![Простой загрузчик, который печатает только `!`](http://oi60.tinypic.com/2qbwup0.jpg)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								В этом примере мы можем видеть, что код будет выполнен в 16-битном режиме реальных адресов и начнёт выполнение с адреса `0x7c00`. После запуска он вызывает прерывание [0x10](http://www.ctyme.com/intr/rb-0106.htm), которое просто печатает символ `!`. Оставшиеся 510 байт заполняются нулями, и код заканчивается двумя магическими байтами `0xaa` и `0x55`.
-												Update linux-bootstrap-1.md
											
										
										
											2015-02-10 16:58:32 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Вы можете увидеть бинарный дамп с помощью утилиты `objdump`:
-												Update linux-bootstrap-1.md
											
										
										
											2015-02-10 16:58:32 +00:00
 								```
-												Fix nasm output format

Output option for flat-form binary files is 'bin'

											
										
										
											2015-04-19 18:40:48 +00:00
+								nasm -f bin boot.nasm
-												Update linux-bootstrap-1.md
											
										
										
											2015-02-10 16:58:32 +00:00
+								objdump -D -b binary -mi386 -Maddr16,data16,intel boot
 								```
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Реальный загрузочный сектор имеет код для продолжения процесса загрузки и таблицу разделов вместо кучи нулей и восклицательного знака :) С этого момента BIOS передаёт управление загрузчику.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								**ЗАМЕЧАНИЕ**: Как уже было упомянуто ранее, ЦПУ находится в режиме реальных адресов; в этом режиме вычисление физического адреса в памяти выполняется следующим образом:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Физический адрес = Селектор сегмента * 16 + Смещение
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								так же, как было упомянуто выше. У нас есть только 16-битные регистры общего назначения; максимальное значение 16-битного регистра - `0xffff`. Поэтому, если мы возьмём максимальное возможное значение, то результат будет следующий:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```python
 								>>> hex((0xffff * 16) + 0xffff)
 								'0x10ffef'
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								где `0x10ffef` равен `1 Мб + 64 Кб - 16 байт`. Процессор [8086](https://en.wikipedia.org/wiki/Intel_8086) (который был первым процессором с режимом реальных адресов), в отличии от этого, имеет 20 битную шину адресации. Поскольку `2^20 = 1048576` это 1 Мб, получается, что фактический объём доступной памяти составляет 1 Мб.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Основная карта разделов в режиме реальных адресов выглядит следующим образом:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+x00000000 - 0x000003FF - Таблица векторов прерываний
 x00000400 - 0x000004FF - Данные BIOS
 x00000500 - 0x00007BFF - Не используется
 x00007C00 - 0x00007DFF - Наш загрузчик
 x00007E00 - 0x0009FFFF - Не используется
-												Исправление ссылок

											
										
										
											2017-01-05 19:04:58 +00:00
+x000A0000 - 0x000BFFFF - RAM (VRAM) видеопамять
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+x000B0000 - 0x000B7777 - Память для монохромного видео
 x000B8000 - 0x000BFFFF - Память для цветного видео
-												Исправление ссылок

											
										
										
											2017-01-05 19:04:58 +00:00
+x000C0000 - 0x000C7FFF - BIOS ROM видеопамяти
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+x000C8000 - 0x000EFFFF - Скрытая область BIOS
 x000F0000 - 0x000FFFFF - Системная BIOS
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								В начале статьи я написал, что первая инструкция, выполняемая ЦПУ, расположена по адресу `0xFFFFFFF0`, значение которого намного больше, чем `0xFFFFF` (1 Мб). Каким образом ЦПУ получает доступ к этому участку в режиме реальных адресов? Ответ на этот вопрос находится в документации [coreboot](http://www.coreboot.org/Developer_Manual/Memory_map):
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+xFFFE_0000 - 0xFFFF_FFFF: 128 Кб ROM отображаются на адресное пространство
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								В начале выполнения BIOS находится не в RAM, а в ROM.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Загрузчик
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								--------------------------------------------------------------------------------
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Существует несколько загрузчиков Linux, такие как [GRUB 2](https://www.gnu.org/software/grub/) и [syslinux](http://www.syslinux.org/wiki/index.php/The_Syslinux_Project). Ядро Linux имеет [протокол загрузки](https://github.com/torvalds/linux/blob/master/Documentation/x86/boot.txt), который определяет требования к загрузчику для реализации поддержки Linux. В этом примере будет описан GRUB 2.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Теперь, когда BIOS выбрал загрузочное устройство и передал контроль управления коду в загрузочном секторе, начинается выполнение [boot.img](http://git.savannah.gnu.org/gitweb/?p=grub.git;a=blob;f=grub-core/boot/i386/pc/boot.S;hb=HEAD). Этот код очень простой в связи с ограниченным количеством свободного пространства и содержит указатель, который используется для перехода к основному образу GRUB 2. Основной образ начинается с [diskboot.img](http://git.savannah.gnu.org/gitweb/?p=grub.git;a=blob;f=grub-core/boot/i386/pc/diskboot.S;hb=HEAD), который обычно располагается сразу после первого сектора в неиспользуемой области перед первым разделом. Приведённый выше код загружает оставшуюся часть основного образа, который содержит ядро и драйверы GRUB 2 для управления файловой системой. После загрузки остальной части основного образа, код выполняет [grub_main](http://git.savannah.gnu.org/gitweb/?p=grub.git;a=blob;f=grub-core/kern/main.c).
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								`grub_main` инициализирует консоль, получает базовый адрес для модулей, устанавливает корневое устройство, загружает/обрабатывает файл настроек grub, загружает модули и т.д. В конце выполнения, `grub_main` переводит grub обратно в нормальный режим. `grub_normal_execute` (из `grub-core/normal/main.c`) завершает последние приготовления и отображает меню выбора операционной системы. Когда мы выбираем один из пунктов меню, запускается `grub_menu_execute_entry`, который в свою очередь запускает команду grub `boot`, загружающую выбранную операционную систему.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												mention boot linker script as suggeset by @Aaron1011

											
										
										
											2017-07-08 16:27:00 +00:00
+								Из протокола загрузки видно, что загрузчик должен читать и заполнять некоторые поля в заголовке ядра, который начинается со смещения `0x01f1` в коде настроек. Вы можете посмотреть загрузочный [скрипт компоновщика](https://github.com/torvalds/linux/blob/master/arch/x86/boot/setup.ld#L16), чтобы убедиться в этом. Заголовок ядра [arch/x86/boot/header.S](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S) начинается с:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    .globl hdr
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								hdr:
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    setup_sects: .byte 0
 								    root_flags:  .word ROOT_RDONLY
 								    syssize:     .long 0
 								    ram_size:    .word 0
 								    vid_mode:    .word SVGA_MODE
 								    root_dev:    .word 0
 								    boot_flag:   .word 0xAA55
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Загрузчик должен заполнить этот и другие заголовки (которые помеченные как тип `write` в протоколе загрузки Linux, например, в [данном примере](https://github.com/torvalds/linux/blob/master/Documentation/x86/boot.txt#L354)) значениями, которые он получил из командной строки или вычисленными значениями. (Мы не будет вдаваться в подробности и описывать все поля заголовка ядра, но, когда он будет их использовать, вернёмся к этому; тем не менее вы можете найти полное описание всех полей в [протоколе загрузки](https://github.com/torvalds/linux/blob/master/Documentation/x86/boot.txt#L156).)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Как мы видим из протокола, после загрузки ядра карта распределения памяти будет выглядеть следующим образом:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```shell
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								         | Ядро защищённого режима  |
 +--------------------------+
 								         | Память I/O               |
 A0000   +--------------------------+
 								         | Резерв для BIOS          | Оставлен максимально допустимый размер
 								         ~                          ~
 								         | Командная строка         | (Может быть ниже X+10000)
 								X+10000  +--------------------------+
 								         | Стек/куча                | Используется кодом ядра в режиме реальных адресов
 								X+08000  +--------------------------+
 								         | Настройки ядра           | Код ядра режима реальных адресов.
 								         | Загрузочный сектор ядра  | Унаследованный загрузочный сектор ядра.
 								       X +--------------------------+
 								         | Загрузчик                | <- Точка входа загрузочного сектора 0x7C00
 +--------------------------+
 								         | Резерв для MBR/BIOS      |
 +--------------------------+
 								         | Обычно используется MBR  |
 +--------------------------+
 								         | Используется только BIOS |
 +--------------------------+
 								```
 								Итак, когда загрузчик передаёт управление ядру, он запускается с:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
-												Fix math error

Fixed math error because X = 0x001000+sizeof(boot loader)

											
										
										
											2017-02-02 18:02:01 +00:00
+								X + sizeof(KernelBootSector) + 1
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								где `X` -  это адрес загруженного сектора загрузки ядра. В моем случае `X` это `0x10000`, как мы можем видеть в дампе памяти:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								![Первый адрес ядра](http://oi57.tinypic.com/16bkco2.jpg)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Сейчас загрузчик поместил ядро Linux в память, заполнил поля заголовка, а затем переключился на него. Теперь мы можем перейти непосредственно к коду настройки ядра.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Запуск настройки ядра
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								--------------------------------------------------------------------------------
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Наконец-то, мы находимся в ядре! Технически, ядро ещё не работает; во-первых, нам нужно настроить ядро, менеджер памяти, менеджер процессов и т.д. Настройка ядра начинается в [arch/x86/boot/header.S](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S), начиная со [_start](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L293). Это немного странно на первый взгляд, так как перед этим есть ещё несколько инструкций.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Давным-давно у Linux был свой загрузчик, но сейчас, если вы запустите, например:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
 								qemu-system-x86_64 vmlinuz-3.18-generic
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								то увидите:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								![Попытка использовать vmlinuz в qemu](http://oi60.tinypic.com/r02xkz.jpg)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								На самом деле, `header.S`  начинается с [MZ](https://en.wikipedia.org/wiki/DOS_MZ_executable) (см. картинку выше), вывода сообщения об ошибке и [PE](https://en.wikipedia.org/wiki/Portable_Executable) заголовка:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
 								#ifdef CONFIG_EFI_STUB
 								# "MZ", MS-DOS header
 								.byte 0x4d
 								.byte 0x5a
 								#endif
 								...
 								...
 								...
 								pe_header:
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    .ascii "PE"
 								    .word 0
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Это нужно, чтобы загрузить операционную систему с [UEFI](https://en.wikipedia.org/wiki/Unified_Extensible_Firmware_Interface). Мы не будем смотреть на его внутреннюю работу прямо сейчас; это будет в одной из следующих глав.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Настоящая настройка ядра начинается с:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Fix linux-bootstrap-1.md

Fix some offset and size errors.
Replace the ambiguous term "segment" by "segment selector".
Add an explanation for the reset vector address.
Fix a typo in the segment register align part (it's a cld and not a cli).
Add missing syntax highlighting.

											
										
										
											2016-01-20 00:05:56 +00:00
+								```assembly
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								// header.S строка 292
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								.globl _start
 								_start:
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Загрузчик (grub2 или другой) знает об этой метке (смещение `0x200` от `MZ`) и сразу переходит на неё, несмотря на то, что `header.S` начинается с секции `.bstext`, которая выводит сообщение об ошибке:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
 								//
 								// arch/x86/boot/setup.ld
 								//
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								. = 0;                    // текущая позиция
 								.bstext : { *(.bstext) }  // поместить секцию .bstext в позицию 0
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								.bsdata : { *(.bsdata) }
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Точка входа настройки ядра:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    .globl _start
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								_start:
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    .byte  0xeb
 								    .byte  start_of_setup-1f
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+:
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    //
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								    // остальная часть заголовка
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    //
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Здесь мы можем видеть опкод инструкции `jmp` (`0xeb`) к метке `start_of_setup-1f`. Нотация `Nf` означает, что `2f` ссылается на следующую локальную метку `2:`; в нашем случае это метка `1`, которая расположена сразу после инструкции jump и содержит оставшуюся часть [заголовка](https://github.com/torvalds/linux/blob/master/Documentation/x86/boot.txt#L156). Сразу после заголовка настроек мы видим секцию .entrytext, которая начинается с метки `start_of_setup`.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Это первый код, который на самом деле запускается (отдельно от предыдущей инструкции jump, конечно). После того, как настройщик ядра получил управление от загрузчика, первая инструкция `jmp` располагалась в смещении `0x200` от начала реальных адресов, т.е после первых 512 байт. Об этом можно узнать из протокола загрузки ядра Linux, а также увидеть в исходном коде grub2:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```C
-												Help readers not to confuse with segment addr and phy addr

and a minor typo
											
										
										
											2016-04-02 21:20:43 +00:00
+								segment = grub_linux_real_target >> 4;
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								state.gs = state.fs = state.es = state.ds = state.ss = segment;
 								state.cs = segment + 0x20;
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Это означает, что после начала настройки ядра регистры сегмента будут иметь следующие значения:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
-												missing register

											
										
										
											2015-09-20 18:51:17 +00:00
+								gs = fs = es = ds = ss = 0x1000
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								cs = 0x1020
 								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								В моём случае, ядро загружается в `0x10000`.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								После перехода на метку `start_of_setup`, необходимо соблюсти следующие условия:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								* Убедиться, что все значения всех сегментных регистров равны
 								* Правильно настроить стек, если это необходимо
 								* Настроить [BSS](https://en.wikipedia.org/wiki/.bss)
 								* Перейти к C-коду в [main.c](https://github.com/torvalds/linux/blob/master/arch/x86/boot/main.c)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Давайте посмотрим, как эти условия выполняются.
 								Выравнивание сегментных регистров
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								--------------------------------------------------------------------------------
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Прежде всего, ядро гарантирует, что сегментные регистры `ds` и `es` указывают на один и тот же адрес. Затем оно сбрасывает флаг направления с помощью инструкции `cld`:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    movw    %ds, %ax
 								    movw    %ax, %es
 								    cld
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Как я уже писал ранее, grub2 загружает код настройки ядра по адресу `0x10000` и `cs` по адресу `0x1020`, потому что исполнение не начинается с начала файла, а с
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Fix linux-bootstrap-1.md

Fix some offset and size errors.
Replace the ambiguous term "segment" by "segment selector".
Add an explanation for the reset vector address.
Fix a typo in the segment register align part (it's a cld and not a cli).
Add missing syntax highlighting.

											
										
										
											2016-01-20 00:05:56 +00:00
+								```assembly
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								_start:
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    .byte 0xeb
 								    .byte start_of_setup-1f
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								инструкции `jump`, расположение которой смещено на 512 байт от [4d 5a](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L47). Также необходимо выровнять `cs` с `0x10200` на `0x10000`, а также остальные сегментные регистры. После этого мы настраиваем стек:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    pushw   %ds
 								    pushw   $6f
 								    lretw
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								кладём значение `ds` на стек по адресу метки [6](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L494) и выполняем инструкцию `lretw`. Когда мы вызываем `lretw`, она загружает адрес метки `6` в регистр [счётчика команд (IP)](https://en.wikipedia.org/wiki/Program_counter), и загружает `cs` со значением `ds`. После этого `ds` и `cs` будут иметь одинаковые значения.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Настройка стека
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								--------------------------------------------------------------------------------
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Почти весь код настройки - это подготовка для среды языка C в режиме реальных адресов. Следующим [шагом](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L467) является проверка значения регистра `ss` и создании правильного стека, если значение `ss` неверно:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    movw    %ss, %dx
 								    cmpw    %ax, %dx
 								    movw    %sp, %dx
 								    je      2f
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Это может привести к трём различны сценариям:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Исправление форматирования констант

											
										
										
											2017-07-08 16:44:00 +00:00
+								* `ss` имеет верное значение `0x10000` (как и все остальные сегментные регистры рядом с `cs`)
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								* `ss` является некорректным и установлен флаг `CAN_USE_HEAP` (см. ниже)
 								* `ss` является некорректным и флаг `CAN_USE_HEAP` не установлен (см. ниже)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Давайте рассмотрим все три сценария:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Исправление форматирования констант

											
										
										
											2017-07-08 16:44:00 +00:00
+								* `ss` имеет верный адрес (`0x10000`). В этом случае мы переходим на метку [2](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L481):
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Fix linux-bootstrap-1.md

Fix some offset and size errors.
Replace the ambiguous term "segment" by "segment selector".
Add an explanation for the reset vector address.
Fix a typo in the segment register align part (it's a cld and not a cli).
Add missing syntax highlighting.

											
										
										
											2016-01-20 00:05:56 +00:00
+								```assembly
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+:  andw    $~3, %dx
 								    jnz     3f
 								    movw    $0xfffc, %dx
 :  movw    %ax, %ss
 								    movzwl  %dx, %esp
 								    sti
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Здесь мы видим выравнивание сегмента `dx` (содержащего значение `sp`, полученное загрузчиком) 4 байтами и проверку - является ли полученное значение нулём. Если ноль, то помещаем `0xfffx` (выровненный 4 байтами адрес до максимального значения сегмента за вычетом 64 Кб) в `dx`. Если не ноль, продолжаем использовать `sp`, полученный от загрузчика (в моём случае 0xf7f4). После этого мы помещаем значение `ax` в `ss`, который хранит правильный адрес сегмента `0x10000` и устанавливает правильное значение `sp`. Теперь мы имеем правильный стек:
 								![стек](http://oi58.tinypic.com/16iwcis.jpg)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-2.md, LINKS.md, CONTRIBUTING.md, исправление ошибок

											
										
										
											2016-12-29 10:50:38 +00:00
+								* Второй сценарий (когда `ss` != `ds`). Во-первых, поместим значение [_end](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L481) (адрес окончания кода настройки) в `dx` и проверим поле заголовка `loadflags` инструкцией `testb`, чтобы проверить, можем ли мы использовать кучу (heap). [loadflags](https://github.com/torvalds/linux/blob/master/arch/x86/boot/header.S#L321) является заголовком с битовой маской, который определяется как:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```C
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								#define LOADED_HIGH     (1<<0)
 								#define QUIET_FLAG      (1<<5)
 								#define KEEP_SEGMENTS   (1<<6)
 								#define CAN_USE_HEAP    (1<<7)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								и, как мы можем узнать из протокола загрузки:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								Field name: loadflags
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								  This field is a bitmask.
 								  Bit 7 (write): CAN_USE_HEAP
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    Set this bit to 1 to indicate that the value entered in the
 								    heap_end_ptr is valid.  If this field is clear, some setup code
 								    functionality will be disabled.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Если бит `CAN_USE_HEAP` установлен, мы помещаем `heap_end_ptr` в `dx` (который указывает на `_end`) и добавляем к нему `STACK_SIZE` (минимальный размер стека, 512 байт). После этого, если `dx` без переноса (так и будет, dx = _end + 512), переходим на метку `2` (как в предыдущем случае) и создаём правильный стек.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								![стек](http://oi62.tinypic.com/dr7b5w.jpg)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								* Когда флаг `CAN_USE_HEAP` не установлен, мы просто используем минимальный стек от `_end` до `_end + STACK_SIZE`:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								![минимальный стек](http://oi60.tinypic.com/28w051y.jpg)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Настройка BSS
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								--------------------------------------------------------------------------------
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Последние два шага, которые нужно выполнить перед тем, как мы сможем перейти к основному C-коду, это настройка [BSS](https://en.wikipedia.org/wiki/.bss)  и проверка "магических" сигнатур. Сначала проверка сигнатур:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    cmpl    $0x5a5aaa55, setup_sig
 								    jne     setup_bad
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Это просто сравнение [setup_sig](https://github.com/torvalds/linux/blob/master/arch/x86/boot/setup.ld#L39) с магическим числом `0x5a5aaa55`. Если они не равны, возникает фатальная ошибка.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Если магические числа совпадают, зная, что у нас есть набор правильно настроенных сегментных регистров и стек, нам всего лишь нужно настроить BSS, прежде чем перейти к C-коду.
-												Update linux-bootstrap-1.md

A small review of the BSS area. I hope you find the changes acceptable - the changes proposed here should improve the narrative flow, as well as provide a slightly clearer explanation as to what the x86 code is doing (for those less familiar with native x86 instructions).
											
										
										
											2015-03-27 20:42:31 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Секция BSS используется для хранения статически выделенных, неинициализированных данных. Linux тщательно обнуляет эту область памяти, используя следующий код:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    movw    $__bss_start, %di
 								    movw    $_end+3, %cx
 								    xorl    %eax, %eax
 								    subw    %di, %cx
 								    shrw    $2, %cx
 								    rep; stosl
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Во-первых, адрес [__bss_start](https://github.com/torvalds/linux/blob/master/arch/x86/boot/setup.ld#L47) помещается в `di`. Далее, адрес `_end + 3` (+3 - выравнивает до 4 байт) помещается в `cx`. Регистр `eax` очищается (с помощью инструкции `xor`), а размер секции BSS (`cx`-`di`) вычисляется и помещается в `cx`. Затем `cx` делится на 4 (размер 'слова' (англ. word)), а инструкция `stosl` используется повторно, сохраняя значение `eax` (ноль) в адрес, на который указывает `di`, автоматически увеличивая `di` на 4 (это продолжается до тех пор, пока `cx` не достигнет нуля). Эффект от этого кода в том, что теперь все 'слова' в памяти от `__bss_start` до `_end` заполнены нулями:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								![bss](http://oi59.tinypic.com/29m2eyr.jpg)
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Переход к основному коду
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								--------------------------------------------------------------------------------
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Вот и все, теперь у нас есть стек и BSS, поэтому мы можем перейти к C-функции `main()`:
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
 								```assembly
-												Normalize indentation in linux-bootstrap-1's code sections to improve readability

											
										
										
											2016-01-22 02:11:21 +00:00
+								    calll main
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								```
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Функция `main()` находится в файле [arch/x86/boot/main.c](https://github.com/torvalds/linux/blob/master/arch/x86/boot/main.c). О том, что она делает, вы сможете узнать в следующей части.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Заключение
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								--------------------------------------------------------------------------------
-												Перевод linux-bootstrap-4.md, исправления

											
										
										
											2017-03-05 09:18:38 +00:00
+								Это конец первой части о внутренностях ядра Linux. В следующей части мы увидим первый код на языке C, который выполняется при настройке ядра Linux, реализацию процедур для работы с памятью, таких как `memset`, `memcpy`, `earlyprintk`, инициализацию консоли и многое другое.
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-4.md, исправления

											
										
										
											2017-03-05 09:18:38 +00:00
+								**Пожалуйста, имейте в виду, что английский - не мой родной язык, и я очень извиняюсь за возможные неудобства. Если вы найдёте какие-либо ошибки или неточности в переводе, пожалуйста, пришлите pull request в [linux-insides-ru](https://github.com/proninyaroslav/linux-insides-ru).**
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								Ссылки
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								--------------------------------------------------------------------------------
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								  * [Справочник программиста Intel 80386 1986](http://css.csail.mit.edu/6.858/2014/readings/i386.pdf)
 								  * [Минимальный загрузчик для архитектуры Intel®](https://www.cs.cmu.edu/~410/doc/minimal_boot.pdf)
-												linux-bootstrap-1.md added

											
										
										
											2015-01-03 18:59:23 +00:00
+								  * [8086](http://en.wikipedia.org/wiki/Intel_8086)
 								  * [80386](http://en.wikipedia.org/wiki/Intel_80386)
-												Перевод linux-bootstrap-1.md

											
										
										
											2016-12-01 18:19:17 +00:00
+								  * [Вектор прерываний](http://en.wikipedia.org/wiki/Reset_vector)
 								  * [Режим реальных адресов](http://en.wikipedia.org/wiki/Real_mode)
 								  * [Протокол загрузки ядра Linux](https://www.kernel.org/doc/Documentation/x86/boot.txt)
 								  * [Справочник разработчика CoreBoot](http://www.coreboot.org/Developer_Manual)
 								  * [Список прерываний Ральфа Брауна](http://www.ctyme.com/intr/int.htm)
 								  * [Источник питания](http://en.wikipedia.org/wiki/Power_supply)
 								  * [Сигнал "Питание в норме"](http://en.wikipedia.org/wiki/Power_good_signal)