> For the complete documentation index, see [llms.txt](https://osh.fducslg.com/operating-systems-h-24fall/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://osh.fducslg.com/operating-systems-h-24fall/shi-yan/lab-6-inode-based-fs.md).

# Lab 6: Inode-based FS

负责助教：[王天泽](mailto:21302010017@m.fudan.edu.cn)

本次实验将实现基于 Inode 的文件系统的基础底层操作。**本实验工作量较大，请大家尽早开始。**

## 1. 服务器操作

```shell
# 拉取远端仓库
git fetch --all

# 提交你的更改
git add .
git commit -m "your commit message"

# 切换到新lab的分支
git checkout lab6

# 新建一个分支，用于开发
git checkout -b lab6-dev

# 引入你在上个lab的更改
git merge lab5-dev
```

## 2. 文件系统扫盲（续）

### 2.1. Inode：文件和目录的统一抽象

在上一次实验中，我们实现了一个简单的文件系统的基层操作，我们现在可以：

* 随意地读取或写入一个块；
* 利用事务一次性写入多个块，而且保证写入的一致性；
* 任意分配或释放一个块。

但是，和我们平时使用的文件系统相比，我们还缺少了一些核心的组件。毕竟，我们口中所说的文件系统一般不是以块（Block）为单位的，而是以文件（File）和目录（Directory）为单位的。我们需要一种能够把块组织成文件和目录的方法，这就是 Inode。

Inode 的名称是 **I**ndex **node** 的缩写，它是文件系统中的一个重要的概念，这里的 Index 指它具有索引的用途。

简单来说，一个 inode 就是一个硬盘上的文件或目录的抽象，它包含了文件或目录的元信息（metadata），比如文件大小、文件名，以及文件内容所在的块号等等。

在 Inode 中，目录其实也是一种特殊的文件：它的内容是一系列的文件名和对应的 inode 号。这样，我们就可以通过读取目录的内容来得到它所包含的所有文件和目录的信息。

{% hint style="info" %}
实际上，可以把 Inode 类比为一棵树中的各个节点，叶节点是我们所说的「文件」，非叶节点就是我们所说的「目录」。
{% endhint %}

Inode 在文件系统中的位置如下：

{% hint style="warning" %}
**注意：**&#x8FD9;里的 0 代表我们的文件系统的起始块号，不是实际的 SD 卡的起始块号。SD 卡布局参考 Lab 4.2 文档中相关布局。
{% endhint %}

| 起始块号           | 长度                                             | 用途           |
| -------------- | ---------------------------------------------- | ------------ |
| 0              | 1                                              | 超级块          |
| `log_start`    | `num_log_blocks`                               | 日志区域         |
| `inode_start`  | `num_inodes * sizeof(InodeEntry) / BLOCK_SIZE` | **inode 区域** |
| `bitmap_start` | `num_bitmap_blocks`                            | 位图区域         |
| `data_start`   | `num_data_blocks`                              | 数据区域         |

为了便于管理，我们的每个 Inode 都具有一个编号。这个编号就是 Inode 在 Inode 区域中的偏移量，第一个 Inode 的编号为 1，第二个 Inode 的编号为 2，以此类推。

当然，由于一个 inode 不会占用整个块（在我们的实验中一个 `InodeEntry` 是 64 字节），所以我们可以把多个 inode 放在一个块中。这样，我们就需要通过块号和块内偏移量来定位一个 inode。

{% hint style="info" %}
**你知道吗？**

由于设计原因，我们不使用 0 作为 Inode 的编号的开始：0 将会在一些函数中用于表示「没有 Inode」的意思。

延伸阅读：<https://stackoverflow.com/questions/2099121/why-do-inode-numbers-start-from-1-and-not-0>
{% endhint %}

回想一下，实际文件系统中对文件和目录的操作是繁多的：读取、写入、新建、删除文件/目录，列出目录内容……等等。我们需要实现哪些接口才能完成这些操作呢？

#### 2.1.1. 作为文件的操作

让我们先从简单的情况开始：只考虑 inode 是文件（毕竟目录只是一种特殊的文件）。

最简单的接口如下所示：

a. 用于读写 inode 中元数据（例如文件大小、修改日期等）：

```c
// 读入一个 inode，返回一个可以用于读写的 Inode 指针
Inode *acquire(int inode_no);
// 标记为脏
void sync(Inode *inode);
// 释放一个 inode
void release(Inode *inode);
```

b. 用于读写 inode 对应的文件内容：

```c
// 将长度为 len 的 buf 写入 inode 的 offset 处
void write(Inode *inode, void *buf, int offset, int len);
// 将 inode 的 offset 处的 len 字节读入 buf
void read(Inode *inode, void *buf, int offset, int len);
// 清空 inode 的内容（使文件变成长度为 0 的空文件）
void clear(Inode *inode);
```

c. 用于分配 inode：

```c
// 新建一个 inode
int alloc();
```

你可能要问了：怎么没有 **删除一个文件（inode）** 的接口？因为它更复杂。

让我们先考虑一个问题：**一个文件可以同时被多个进程访问吗？**

这种需求显然是存在的。比如，我们平时运行一个程序的时候可能会去看它的日志文件。这时，我们的程序和我们的文本编辑器都会去打开这个文件，一个读取、一个写入。如果两边反复地 acquire 和 release inode，那么效率会很低。更好的想法是：能不能仅仅在读写操作上互斥（也就是说，虽然可以同时打开，如果一个进程正在读写文件，那么其他进程就不能读取或写入这个文件）？

这里其实就是对一个操作的拆解。在块缓存中，我们的 acquire 其实完成了三件事：

1. 建立（或者从链表中找到）一个块（可以称为 `get`）；
2. 如果块不在内存中，从硬盘上**读取**块（可以称为 `read_block`）；
3. 获取这个块上的读写锁（可以称为 `lock`）。

仔细想想，其实我们可以把这三件事分开来做。比如，三个进程其实都希望 `get` 一个 inode，但未必都需要 `read_inode`，也未必马上就要 `lock`。

让我们细分出一套接口来替代上面的 a. 类接口：

```c
// 获得一个 inode
Inode *get(int inode_no);
// 获取 inode 的读写锁
void lock(Inode *inode);
// 读取或标记一个 inode 为脏。sync(inode, true) 等价于原来的 sync，sync(inode, false) 等价于 read_inode
void sync(Inode *inode, bool do_write);
// 释放 inode 的读写锁
void unlock(Inode *inode);
// 释放 inode
void put(Inode *inode);
```

这样 `acquire = get + lock + sync(false)`，`sync = sync(true)`，`release = unlock + put`。

由于同一个 inode 引用可以同时被多个进程 `get/put` 了，所以我们需要一个计数器来记录当前有多少进程正在使用这个 inode，这样才知道什么时候可以把 inode 从链表中删除。这个计数器就是 `Inode` 结构体中的 `rc` 字段

回到删除文件的问题上来。让我们从头开始考虑文件可被实际从硬盘上删除的条件：

1. 文件没有被任何进程**打开**（或者说，所有之前打开文件的进程都已经 `put` 这个文件）；
2. 文件不再在文件系统中被需要（即，它已经不是叶节点）。

我们平时所说的「删除文件」其实是想完成第二件事：删除文件的目录项，使得文件从 Inode 树中脱离，用 `ls` 命令不再能看到它。但是，这并不意味着文件就真的被删除了：如果还有进程在使用它，它仍然占用着硬盘上的空间。

怎么知道文件不再被文件系统需要呢？我们需要另一个计数器来记录当前有多少位置引用了这个文件（例如目录项、硬连接等）。这个计数器就是我们的 `InodeEntry` 结构体中维护的 `num_links` 字段。

当两个计数器的值都降到 0 时，我们就可以真正删除这个文件了。

**所以，删除之所以没有列出来，是因为实际的删除逻辑是一个自然发生的过程**：我们只需要在所有可能导致上面两个条件满足的地方，检查两个计数器的值，如果都是 0 就调用释放 inode 的方法即可。

在本实验中，我们暂时还不涉及修改 `num_links` 的逻辑，而唯一减少 `rc` 的地方只有 `put`，所以我们只需要在 `put` 的时候检查 `rc` 和 `num_links` 即可。

此外，我们还添加了一个接口，用于一些进程显式地表示自己需要 `get` 两次（例如可能它要把自己的 inode 指针交给两个方法，两个方法都会调用 `put` 来释放这个 inode）：

```c
// 让 inode 的引用计数加一
Inode *share(Inode *inode);
```

总结一下，我们的接口包括：

```c
// === 和块缓存差不多的读写操作 ===
// 获得一个 inode（依然在inode中维护一个链表，）
Inode *get(int inode_no);
// 获取 inode 的读写锁，若valid项为false，需要读入inodeentry
void lock(Inode *inode);
// 读取或标记一个 inode 为脏
void sync(Inode *inode, bool do_write);
// 释放 inode 的读写锁
void unlock(Inode *inode);
// 释放 inode，判断是否清空inode内容
void put(Inode *inode);

// === 读写 inode 对应文件的内容 ===

// 获取inode在offset位置的块号，同时若ctx!=NULL且offset超过当前文件大小，会allocate新的一块并标记modified为true
usize map(OpContext *ctx, Inode *inode, usize offset, bool *modified)
// 将长度为 len 的 buf 写入 inode 的 offset 处
void write(Inode *inode, void *buf, int offset, int len);
// 将 inode 的 offset 处的 len 字节读入 buf
void read(Inode *inode, void *buf, int offset, int len);
// 清空 inode 的内容（使文件变成长度为 0 的空文件）
void clear(Inode *inode);

// === inode 本身的分配 ===
// 分配一个 inode
Inode *alloc();

// === inode 辅助操作 ===
// 让 inode 的引用计数加一
Inode *share(Inode *inode);
```

#### 2.1.2. inode 储存文件详解

我们的 inode 中用于指向数据区域的字段是 `addrs`。这个字段的类型是 `u32 addrs[INODE_NUM_DIRECT]`，其中 `INODE_NUM_DIRECT` 是一个常量，表示直接指向数据块的指针的个数。

例如，一个文件有 4.5 \* 512 = 2304 字节，则它占用 5 个块的空间。那么，这个文件的 inode 的 `inode.addrs` 字段的前 5 个元素就是这 5 个块的块号，而 `inode.num_bytes == 2304`。

我们的 `INODE_NUM_DIRECT` 为 12，也就是说，最多可以直接指向 12 个块。如果一个文件占用的空间超过了 12 个块（即超过 6 KB），我们就需要使用**间接块**来指向更多的块。

间接块的块号是 `inode.indirect`。当文件小于 6KB 时，可以用 0 表示没有间接块。`inode.indirect` 指向一个块，这个块中的内容是一系列块号，这些块号指向文件的后续块。

举个例子，如果一个文件占用了以下块：

```
1001,1002,1003,1004,1005,1006,1007,1008,1009,1010,1011,1012,1013,1014,1015,1016,1017,1018,1019,1020
```

那么，这个文件的 inode 为（假设间接块的块号为 6666）：

```
inode.addrs = [1001,1002,1003,1004,1005,1006,1007,1008,1009,1010,1011,1012]

inode.indirect = 6666
```

而 6666 号块的内容为：

```
[1013,1014,1015,1016,1017,1018,1019,1020]
```

为了根据在文件中的位置获得对应的块，便于 `read` 和 `write` 的实现，我们建议实现一个工具方法 `inode_map`，它用于在给定字节位置的情况下找到对应的块。

仍以上面的文件为例，有：

```c
inode_map(inode, 0) == 1001 // 第 0 字节在 1001 号块
inode_map(inode, 1023) == 1002 // 第 1023 字节在 1002 号块
inode_map(inode, 10239) == 1020 // 第 10239 字节在 1020 号块
inode_map(inode, 10240) == ??? // 第 10240 字节已经超过了文件的大小，用 block_alloc 分配一个新块，加入到 6666 块中，然后返回新块的块号
```

#### 2.1.3. 作为目录的操作

我们的文件系统中，目录也是一种特殊的文件。目录的内容是一系列的 `DirEntry`，每个 `DirEntry` 由一个 `inode_no` 和一个 `name` 组成。`inode_no` 是这个文件的 inode 的编号，`name` 是这个文件的名字。

例如，一个目录的内容是：

```
DirEntry[0] = {inode_no: 1, name: "a"}
DirEntry[1] = {inode_no: 2, name: "b"}
DirEntry[2] = {inode_no: 3, name: "c"}
```

为了方便后续实现，我们要求大家实现三个有用的接口：

```c
// 向目录增加一项 {inode_no, name}
void insert(Inode *dir_inode, int inode_no, const char *name);
// 从目录中删除第 index 项
void remove(Inode *dir_inode, int index);
// 从目录中查找名字为 name 的文件，返回它的 inode 编号
int lookup(Inode *dir_inode, const char *name);
```

因为目录只是文件的一种，你可以直接用 `read/write` 等方法来实现这三个接口。

## 3. 任务

{% hint style="success" %}
完成inode.c中所有函数（函数需要实现的具体功能见上）

```c
static Inode* inode_get(usize inode_no)
static void inode_lock(Inode* inode)
static void inode_sync(OpContext* ctx, Inode* inode, bool do_write)
static void inode_unlock(Inode* inode)
static void inode_put(OpContext* ctx, Inode* inode)

static usize inode_map(OpContext *ctx, Inode *inode, usize offset, bool *modified)
static usize inode_read(Inode* inode, u8* dest, usize offset, usize count)
static usize inode_write(OpContext* ctx, Inode* inode, u8* src, usize offset, usize count)
static void inode_clear(OpContext* ctx, Inode* inode)


static Inode* inode_share(Inode* inode)
static usize inode_alloc(OpContext* ctx, InodeType type)


static usize inode_lookup(Inode* inode, const char* name, usize* index)
static usize inode_insert(OpContext* ctx, Inode* inode, const char* name, usize inode_no)
static void inode_remove(OpContext* ctx, Inode* inode, usize index)
```

{% endhint %}

## 4. 评测

本次实验我们继续使用基于 Mock 的评测方法，离开树莓派环境来测试你的文件系统。相关 C/C++ 代码在 `src/fs/test` 目录下。

首次评测时请在 `src/fs/test` 下执行：

```sh
$ mkdir build
$ cd build
$ cmake ..
```

之后每次评测时请在 `src/fs/test/build` 下执行：

```sh
$ make inode_test && ./inode_test
```

如果报错，请尝试清理：

```sh
$ make clean
```

通过标准：没有显示任何 `(error)` 和 `(fatal)` 输出，则通过评测。

## 5. 提交

**提交：将实验报告提交到 eLearning 上，格式为 `学号-lab6.pdf`。**

**注意**：从 `lab1` 开始，用于评分的代码以实验报告提交时为准。如果需要使用新的代码版本，请重新提交实验报告。

**截止时间：**<mark style="color:red;">**12 月 6 日 23:59**</mark>**。**&#x903E;期提交将扣除部分分数。

报告中可以包括下面内容

* 代码运行效果展示（测试通过截图）
* 实现思路和创新点
* 对后续实验的建议
* 其他任何你想写的内容

报告中不应有大段代码的复制。如有使用本地环境进行实验的同学，请联系助教提交代码（最好可以给个 GIT 仓库）。使用服务器进行实验的同学，助教会在服务器上检查，不需要另外提交代码。

在服务器上操作的同学，此次实验完成后请提交（或者说创建一个新分支）到 `lab6-submission` 分支，助教会使用你在此分支上提交记录来批作业。如果此分支最后提交时间晚于实验报告提交时间，助教会选择此分支上在实验报告提交时间前的最后一个提交作为批改代码。

**提交操作**：

```shell
# 提交最后的代码
git add .
git commit -m "your final commit message"

# 新建一个分支，用于提交
git checkout -b lab6-submission
```

## 6. 参考资料

\[1] 聊聊 xv6 中的文件系统：<https://www.cnblogs.com/KatyuMarisaBlog/p/14366115.html>

\[2] xv6 中文文档：<https://th0ar.gitbooks.io/xv6-chinese/content/content/chapter6.html>