웹 개발, 크롤링을 해봤다면 HTML을 누구나 들어봤을 것이다. HTML은 Hyper Text MarkUp Language의 줄임말로 웹 페이지의 뼈대를 구성하는 언어다. 즉, HTML은 마크업 언어인데, 그럼 여기서 Mark-UP은 무엇인가?
MarkUp Language
“마크업 언어(Markup Language)는 문서가 화면에 표시되는 형식을 나타내거나 데이터의 논리적인 구조를 명시하기 위한 규칙들을 정의한 언어의 일종이다. 데이터를 기술한 언어라는 점에서 프로그래밍 언어와는 차이가 있다.”
- 간단하게 말해 마크(mark)로 둘러싸인 언어를 의미한다. 태그(tag)로 둘러싸였다고도 표현한다.
- 태그는 원래 텍스트와는 별도의 것으로 원고의 교정부호, 주석을 표현하기 위해 사용되었는데 웹페이지 개발에 있어 그 용도가 확장되어 문서의 구조를 표현하는 역할을 한다.
- 마크업 언어에서 파생된 것이 HTML, XML 같은 것이 있고, 이것들로 문서의 골격에 해당하는 부분을 작성한다.
- 데이터를 기술하는 정도로만 사용되기에 프로그래밍 언어와는 구별된다.
MarkDown Language
- 마크업 언어의 일종이다.
- 사용자가 웹페이지를 개발하고자 HTML 파일을 작성하면 마크업 언어를 알아야한다는 약간의 장벽이 있다. 이 장벽을 좀 더 낮춘 것이 마크다운 언어로, 마크업에 비해 읽고 쓰는게 쉽다는 장점이 있다. 읽기도 쓰기도 쉬운 문서 양식을 지향하기 때문에, 복잡한 태그 구조가 사라지고 간단한 텍스트들과 몇 가지 문법만 알면 작성할 수 있게 했다
- 마크다운 언어의 확장자로
.md
가 있다. 마크다운 언어 기반의 문서를 작성하고.md
확장자의 파일로 저장하면 해당 문서를 자동으로 HTML 파일로 변환할 수 있다. - 마크다운 같은 간편한게 있다면 굳이 마크업을 안써도 되는거 아닌가?
- 장단점은 아래와 같다. 참고
1. 간결하다.
2. 별도의 도구없이 작성가능하다.
3. 다양한 형태로 변환이 가능하다.
4. 텍스트(Text)로 저장되기 때문에 용량이 적어 보관이 용이하다.
5. 텍스트파일이기 때문에 버전관리시스템을 이용하여 변경이력을 관리할 수 있다.
6. 지원하는 프로그램과 플랫폼이 다양하다.
1. 모든 HTML 마크업을 대신하지 못한다.
2. 표준이 없어 도구에 따라서 변환방식이나 생성물이 다르다.
Lightweight Markup Language (가벼운 마크업 언어)
간결한 문법을 가진 마크업 언어
보통의 마크업 언어보다 문법이 간단하여 이해, 편집, 처리하기가 쉽다
종류는 다음과 같다.
- 시각적인 표시 지향
- BBCode
- Markdown
- Wiki Text
- 데이터 지향
- JSON
- 시각적인 표시 지향
Wiki Markup (Wiki Text)
- 위키백과와 같이 위키 웹사이트에 페이지를 기록하는 데 쓰이는 가벼운 마크업 언어이다.
- 표준 위키 마크업 언어는 존재하지 않는다. 문법, 구조, 기능, 표제어 등은 -웹사이트에 쓰이는 -위키 소프트웨어에 따라 달라진다