Lightnews — Scholar-powered news

브라우저 구현 스터디하면서 파서 구현 중인데, 예외케이스 처리하고 상태 관리로 서커스해야할게 너무 많다. DFA 추상화라도 해야하나 싶어서 다른 구현체 봤더니 실제로 그렇게 하고 있다.

Chromium(Blink) : https://source.chromium.org/chromium/chromium/src/+/main:third_party/blink/renderer/core/html/parser/html_tokenizer.cc;l=1677 관련 표준 : https://html.spec.whatwg.org#tokenisati […]

Original post on hackers.pub

hackers.pub

November 3, 2025 at 6:56 AM

Jaeyeol Lee

@kodingwarrior.hackers.pub.ap.brid.gy

브라우저 스터디 최대한 미리 진도 빼놔야겠다. 머쓱....

November 3, 2025 at 6:06 AM

Jaeyeol Lee

@kodingwarrior.hackers.pub.ap.brid.gy

초안이고, 아직은 완성된 글이 아님. 약속이 있는 관계로 일단 중간 세이브....

Jaeyeol Lee @kodingwarrior.hackers.pub.ap.brid.gy · 12d

브라우저 스터디 기록 (2)

Note 이 글은 Web Browser Engineering 을 독학하면서 시도했던 것들을 의식의 흐름대로 남긴 흔적입니다. TL;DR - Chapter 2 연습문제 풀이를 보고 싶다면 여기서 확인할 수 있다. Chapter 2는 전반적으로 쉬어가는 챕터라는 느낌이 강했다. Chapter 2의 내용을 요약하자면, "브라우저 주소 입력창에 g를 타이핑했을 때 일어나는 일들을 서술하시오"에서 "g를 타이핑했을 때" 입력을 감지하는 과정 그리고 응답을 받았을때 HTML을 화면에 그리는 과정이 어떻게 일어나는지를 서술하는 것에 가깝다. 마우스나 키보드 같은 입출력 장치에서 신호가 발생하면, CPU는 이를 감지하고 커널에 **인터럽트 요청(IRQ, Interrupt Request)** 을 전달한다. 커널은 이 요청을 처리하여 필요한 경우 브라우저 프로그램에 이벤트를 전달하고, 브라우저는 그 신호를 바탕으로 소켓을 통해 인터넷상의 서버에 요청을 보낸다. 서버로부터 응답이 돌아오면, 커널은 이를 다시 브라우저로 전달하고, 브라우저는 받은 데이터를 해석해 그래픽 시스템을 통해 화면에 렌더링한다. 이렇게 해서 우리는 화면 위의 x, y 좌표에 정밀하게 계산되어 그려진 브라우저 화면을 보게 된다. 여기서 핵심적인 요소는, 이벤트 루프를 통해 이벤트를 입력을 감지하고 화면에 그리는 일련의 과정인데, 이번 챕터에서는 간단하게 텍스트를 하나씩 하나씩 화면에 찍어내는 정도로만 그치고 있다. (어떤 운영체제를 쓰느냐에 따라 다를 수는 있겠지만) 브라우저를 구현하려면 Gtk/ Qt 같은 GUI 툴킷의 도움이 필요한데, 챕터 9까지는 간단한 구현을 위해 Tcl/Tk를 쓰고 있다. 그 이후에는 Skia/SDL로 바뀌는 것 같다. ## 연습문제 풀이 2.1는 그냥 개행을 구현하는 기능이고, 2.2/2.3/2.4는 그냥 스크롤 기능을 구현했다면 어렵지 않게 구현이 가능한 기능이니 그냥 넘어가면 될 것 같다. 2.6은 URL 파싱이 실패했을 때, about:blank로 fallback하고 about:blank일 때는 빈 화면이 띄워지게 하면 되니까 아주 간단하다. ### 연습문제 2.5 : Emoji 지원 ### 연습문제 2.7 : RTL 지원 이번에는 좀 트릭이 필요하다. 브라우저는 대부분의 화면에서 텍스트 요소 배치라던가 화면 요소 배치를 왼쪽에서 오른쪽으로 배치(LTR)하는 것이 보편적인데, 오른쪽에서 왼쪽으로 배치(RTL)하는 웹 페이지도 종종 있다. 오른쪽에서 왼쪽으로 필기하는 문화권(아랍어, 히브리어 등등)에서 특히 RTL 지원이 필요하다. 이는 HTML 속성으로도 ltr, rtl 여부를 지정할 수 있다. 물론.... 이 기능을 지원하는 순간부터 후속 챕터 작업할 때, 하위호환성 지원하느라 애를 먹을 수도 있다. 나같은 경우에는 히브리어를 기준으로 테스트했는데, 텍스트를 그대로 가져다 쓸 때는 정상적인 순서로 출력이 되는 것을 볼 수 있다. 하지만, 하나씩 하나씩 화면에 찍어내면 내가 알고 있는 그 문자 구성이 맞는지 의심이 들게 된다. 이를 처리하기 위해서는 RTL 언어를 어떻게 처리할 지에 대해서도 알고 있어야 하고, LTR 언어도 정상적인 순서로 출력되도록 처리하되, LTR 언어/RTL 언어 각각이 한 문장에서 올바른 순서로 출력이 되도록 해야 한다. 엄밀하게는 정규식으로 필터링해서 순서를 뒤집던가해서 하나씩 출력하게 하는 것도 고려해볼 수는 있다. 하지만.... 나는 그냥 다르게 접근했다. xy 좌표를 이미 display_list에 넣어버렸는데, 한 줄에 들어가는 텍스트를 출력하는거면 y 좌표 단위로 묶어서 아예 하나의 문자열로 모아서 출력하면 되지 않은가? RTL 문자를 어떻게 출력하는지는 어지간한 GUI 툴킷에서 따로 처리를 할 것이라는 믿음이 있었기에 그냥 RTL 순서 맞춰서 출력하는건 GUI 툴킷이 하도록 거인의 어깨에 올라탔다. lines: dict[int, list[tuple[int, str]]] = {} for x, y, c in drawable_characters: if y not in lines: lines[y] = [] lines[y].append((x, c)) for y, line_chars in lines.items(): total_width: int = len(line_chars) # 라인 전체 길이 text_segments: list[tuple[int | None, str]] = [] ... text_segments.append((x, word)) # x는 상대 좌표, word는 모아찍을 단어/문장 단위 각각의 문자를 어떻게 정상적으로 출력할지에 대해서 간단하게 살펴봤다. 그렇다면,어떻게 각 라인의 끝이 화면의 오른쪽에 딱 붙어서 출력되게 할 것인가? 이것도 굉장히 자명한 방법이 있는데, y 좌표를 기준으로 출력할 라인을 관리하게 했다면 지금 당장의 가정으로는 고정폭(HSTEP)을 기준으로 라인의 길이를 잴 수 있다. 그렇다면, 라인이 화면에 그려지는 시작점(start_x)를 화면 맨 오른쪽 좌표(WIDTH)에서 라인의 길이를 빼서 계산하고, start_x 중심으로 LTR 기준 화면이 그려지는 상대적인 좌표(x)를 더해서 그려내면 된다. 간단하다. Emoji 출력을 어떻게 할 지에 따라서는, 오히려 간단하게 해결할 수 있는데... display_list에 글자를 하나씩 하나씩 집어넣을때 이모지를 어느 위치에 출력할지에 대해서는 이미 좌표를 지정한 바가 있다. 그렇기 때문에, emoji가 나타나는 위치는 공백으로 치환하되, emoji를 그려야 하는 좌표를 emoji 출력을 위한 다른 리스트에 넣어놓고 텍스트 라인을 화면에 그리는 부분 따로, 이모지를 화면에 그리는 부분 따로 분리를 했다.

hackers.pub

November 2, 2025 at 3:54 AM

Jaeyeol Lee

@kodingwarrior.hackers.pub.ap.brid.gy

브라우저 스터디 기록 (2)

Note 이 글은 Web Browser Engineering 을 독학하면서 시도했던 것들을 의식의 흐름대로 남긴 흔적입니다. TL;DR - Chapter 2 연습문제 풀이를 보고 싶다면 여기서 확인할 수 있다. Chapter 2는 전반적으로 쉬어가는 챕터라는 느낌이 강했다. Chapter 2의 내용을 요약하자면, "브라우저 주소 입력창에 g를 타이핑했을 때 일어나는 일들을 서술하시오"에서 "g를 타이핑했을 때" 입력을 감지하는 과정 그리고 응답을 받았을때 HTML을 화면에 그리는 과정이 어떻게 일어나는지를 서술하는 것에 가깝다. 마우스나 키보드 같은 입출력 장치에서 신호가 발생하면, CPU는 이를 감지하고 커널에 **인터럽트 요청(IRQ, Interrupt Request)** 을 전달한다. 커널은 이 요청을 처리하여 필요한 경우 브라우저 프로그램에 이벤트를 전달하고, 브라우저는 그 신호를 바탕으로 소켓을 통해 인터넷상의 서버에 요청을 보낸다. 서버로부터 응답이 돌아오면, 커널은 이를 다시 브라우저로 전달하고, 브라우저는 받은 데이터를 해석해 그래픽 시스템을 통해 화면에 렌더링한다. 이렇게 해서 우리는 화면 위의 x, y 좌표에 정밀하게 계산되어 그려진 브라우저 화면을 보게 된다. 여기서 핵심적인 요소는, 이벤트 루프를 통해 이벤트를 입력을 감지하고 화면에 그리는 일련의 과정인데, 이번 챕터에서는 간단하게 텍스트를 하나씩 하나씩 화면에 찍어내는 정도로만 그치고 있다. (어떤 운영체제를 쓰느냐에 따라 다를 수는 있겠지만) 브라우저를 구현하려면 Gtk/ Qt 같은 GUI 툴킷의 도움이 필요한데, 챕터 9까지는 간단한 구현을 위해 Tcl/Tk를 쓰고 있다. 그 이후에는 Skia/SDL로 바뀌는 것 같다. ## 연습문제 풀이 2.1는 그냥 개행을 구현하는 기능이고, 2.2/2.3/2.4는 그냥 스크롤 기능을 구현했다면 어렵지 않게 구현이 가능한 기능이니 그냥 넘어가면 될 것 같다. 2.6은 URL 파싱이 실패했을 때, about:blank로 fallback하고 about:blank일 때는 빈 화면이 띄워지게 하면 되니까 아주 간단하다. ### 연습문제 2.5 : Emoji 지원 ### 연습문제 2.7 : RTL 지원 이번에는 좀 트릭이 필요하다. 브라우저는 대부분의 화면에서 텍스트 요소 배치라던가 화면 요소 배치를 왼쪽에서 오른쪽으로 배치(LTR)하는 것이 보편적인데, 오른쪽에서 왼쪽으로 배치(RTL)하는 웹 페이지도 종종 있다. 오른쪽에서 왼쪽으로 필기하는 문화권(아랍어, 히브리어 등등)에서 특히 RTL 지원이 필요하다. 이는 HTML 속성으로도 ltr, rtl 여부를 지정할 수 있다. 물론.... 이 기능을 지원하는 순간부터 후속 챕터 작업할 때, 하위호환성 지원하느라 애를 먹을 수도 있다. 나같은 경우에는 히브리어를 기준으로 테스트했는데, 텍스트를 그대로 가져다 쓸 때는 정상적인 순서로 출력이 되는 것을 볼 수 있다. 하지만, 하나씩 하나씩 화면에 찍어내면 내가 알고 있는 그 문자 구성이 맞는지 의심이 들게 된다. 이를 처리하기 위해서는 RTL 언어를 어떻게 처리할 지에 대해서도 알고 있어야 하고, LTR 언어도 정상적인 순서로 출력되도록 처리하되, LTR 언어/RTL 언어 각각이 한 문장에서 올바른 순서로 출력이 되도록 해야 한다. 엄밀하게는 정규식으로 필터링해서 순서를 뒤집던가해서 하나씩 출력하게 하는 것도 고려해볼 수는 있다. 하지만.... 나는 그냥 다르게 접근했다. xy 좌표를 이미 display_list에 넣어버렸는데, 한 줄에 들어가는 텍스트를 출력하는거면 y 좌표 단위로 묶어서 아예 하나의 문자열로 모아서 출력하면 되지 않은가? RTL 문자를 어떻게 출력하는지는 어지간한 GUI 툴킷에서 따로 처리를 할 것이라는 믿음이 있었기에 그냥 RTL 순서 맞춰서 출력하는건 GUI 툴킷이 하도록 거인의 어깨에 올라탔다. lines: dict[int, list[tuple[int, str]]] = {} for x, y, c in drawable_characters: if y not in lines: lines[y] = [] lines[y].append((x, c)) for y, line_chars in lines.items(): total_width: int = len(line_chars) # 라인 전체 길이 text_segments: list[tuple[int | None, str]] = [] ... text_segments.append((x, word)) # x는 상대 좌표, word는 모아찍을 단어/문장 단위 각각의 문자를 어떻게 정상적으로 출력할지에 대해서 간단하게 살펴봤다. 그렇다면,어떻게 각 라인의 끝이 화면의 오른쪽에 딱 붙어서 출력되게 할 것인가? 이것도 굉장히 자명한 방법이 있는데, y 좌표를 기준으로 출력할 라인을 관리하게 했다면 지금 당장의 가정으로는 고정폭(HSTEP)을 기준으로 라인의 길이를 잴 수 있다. 그렇다면, 라인이 화면에 그려지는 시작점(start_x)를 화면 맨 오른쪽 좌표(WIDTH)에서 라인의 길이를 빼서 계산하고, start_x 중심으로 LTR 기준 화면이 그려지는 상대적인 좌표(x)를 더해서 그려내면 된다. 간단하다. Emoji 출력을 어떻게 할 지에 따라서는, 오히려 간단하게 해결할 수 있는데... display_list에 글자를 하나씩 하나씩 집어넣을때 이모지를 어느 위치에 출력할지에 대해서는 이미 좌표를 지정한 바가 있다. 그렇기 때문에, emoji가 나타나는 위치는 공백으로 치환하되, emoji를 그려야 하는 좌표를 emoji 출력을 위한 다른 리스트에 넣어놓고 텍스트 라인을 화면에 그리는 부분 따로, 이모지를 화면에 그리는 부분 따로 분리를 했다.

hackers.pub

November 2, 2025 at 3:53 AM

Jaeyeol Lee

@kodingwarrior.hackers.pub.ap.brid.gy

브라우저 구현 진짜 빡세다(.....)

November 1, 2025 at 10:04 AM

Jaeyeol Lee

@kodingwarrior.hackers.pub.ap.brid.gy

@daengdaenglee 안녕하세요! 반갑습니다!

November 1, 2025 at 6:16 AM

Jaeyeol Lee

@kodingwarrior.hackers.pub.ap.brid.gy

왠지 아는 사람이 만든 계정인 것만 같다...

Cosmoslide의 프로필 업데이트가 제대로 전파되는지 확인할 목적으로 마스토돈에서 계정을 검색하고 있는데, 지혁님의 VPN에서 만들어진 계정으로 추정되는 것들이 보이고 있다

October 31, 2025 at 8:30 AM

Jaeyeol Lee

@kodingwarrior.hackers.pub.ap.brid.gy

집 도착하면 생활리듬 정상화할겸, 발표 준비도 일찍 준비할겸 일찍 자야겠다......

October 31, 2025 at 7:33 AM

Jaeyeol Lee

@kodingwarrior.hackers.pub.ap.brid.gy

발표 경력이 두자릿수는 넘어가지만, 시간이 촉박한 상황에서 발표하는건 여전히 쫄린다...

October 31, 2025 at 6:37 AM

Jaeyeol Lee

@kodingwarrior.hackers.pub.ap.brid.gy

마크다운 지원이... 시급하다....

RE: https://cosmosli.de/@jaeyeollee/ab42d37e-719b-473d-aedf-afb0ffe76617

cosmosli.de

October 31, 2025 at 6:23 AM

Jaeyeol Lee

@kodingwarrior.hackers.pub.ap.brid.gy

* OSSCA 2025 성과공유회 발표
* 브라우저 스터디 Chapter 2 풀이글? 작성
* 브라우저 스터디 Chapter 3 연습문제 밀기
* 코스모 슬라이드 개발
* 면접 준비

RE: https://hackerspub-ask-bot.deno.dev/message/019a37eb-f800-7de7-9de5-d40aa56e1d3a

hackerspub-ask-bot.deno.dev

October 31, 2025 at 2:12 AM

Add to Home Screen

Light up
your news

Add to Home Screen

Light upyour news

Sign in to Lightnews

Sign up to start reading

Connect Bluesky

Connect with Bluesky

Light up
your news