본문 바로가기

챗 GPT, AI 알아보기

챗GPT 답변을 티스토리 블로그에 복사 붙여넣기 하면 발생하는 HTML문제 해결 방법

최근 챗GPT가 놀라운 발전으로 인기를 끌면서, 챗GPT로 생성한 글을 활용하려는 시도를 많이 찾아볼 수 있고 간혹 챗GPT의 답변을 그대로 복사해서 블로그 글을 작성하려는 시도도 있습니다. 챗GPT가 인간 대신, 훨씬 빠르게 글을 작성해 주니 그걸 블로그에 복사, 붙여넣기해서 적은 노력으로 블로그를 운영하겠다는 건데요. 혹시 챗GPT의 답변을 그대로 복사하면 글의 HTML 태그에 문제가 발생한다는 사실을 알고 계셨나요?

HTML이란?

HTML이란 HyperText Markup Language의 약어입니다. 웹문서, 웹사이트 등을 구성하는 '웹 언어'의 한 종류로서 상당히 단순하고 기본적인 웹 언어입니다. 컴퓨터에 크게 관심이 없는 분들이라면 다소 생소하실 수 있고, 전혀 본 적이 없으실 수 있습니다. 하지만 여러분이 티스토리 블로그에 게시물을 작성하신 적 있다면, 지금까지 티스토리가 알아서 여러분이 작성하신 글을 HTML로 해석해서 작성해 왔습니다.

TISTORY_writing_page
지금 제가 작성중인 화면

지금 제가 이 포스팅을 작성중인 글쓰기 화면입니다. 평소 보던 것처럼 제가 입력한 글들이 평범하게 보이는데요. 상단 메뉴바의 '기본모드'라고 적힌 곳을 클릭하면 사진과 같이 기본모드, 마크다운, HTML을 선택할 수 있게 되어 있죠. 여기서 'HTML'을 클릭하면 아래와 같이 보이게 됩니다.

TISTORY_HTML_MODE
HTML 글쓰기 화면

제가 작성한 글 앞뒤에 뭐가 붙어있죠? 저것들이 HTML태그입니다. 제가 글자 크기를 지정하거나, 줄바꿈을 하거나, 제목으로 지정하거나 하면 그것들을 티스토리에서 HTML태그로 반영해주고 있는 것입니다.

 

일반적으로 포스팅을 작성하고 있다면, 이것들은 별로 문제가 되지 않습니다. 그냥 기본모드에서 본인이 원하는 대로 제목 지정하고, 본문 지정하고, 줄바꿈 하면 티스토리가 알아서 거기에 맞게 HTML태그를 달아 게시해주기 때문입니다. 그러나 챗GPT의 답변을 복사, 붙여넣기 해서 작성하면 HTML 태그에 약간의 문제가 생깁니다.

 

챗GPT 답변을 복사한 글의 HTML 태그 문제

그렇다면 어떤 문제가 발생하는지를 알아야겠죠. 예시를 보여드리기 위해, 챗GPT에게 블로그에 게시할 새우깡 리뷰를 작성해달라고 하고 그것을 붙여넣기 해 보겠습니다. 먼저 챗 GPT에게 리뷰를 작성하라고 요구해볼게요.

GPT_REVIEW
챗GPT의 새우깡 리뷰

 

역시 저보다 훨씬 빠른 속도로 글을 작성해내는 챗GPT입니다. 이제 이 답변 내용을 그대로 복사해서 티스토리 글쓰기의 기본모드에서 붙여넣기를 시도해 보겠습니다.

 

PASTE_GPT_IN_TISTORY
기본모드에 붙여넣기함

 

보시다시피 잘 붙여넣기 되었습니다. 지금 화면에서 보았을때는 아까 직접 작성한 글과 크게 달라보이는 점이 없으실 것입니다. 실제로 기본모드에서 보기에는 직접 적은 글이나 복사 붙여넣기한 글이나 똑같이 보입니다. 하지만 HTML모드로 변환해서 본다면, 눈에 띄는 차이점이 보입니다. 변환한 모습을 보여드리겠습니다.

 

PASTE_GPT_IN_TISTORY_HTML
HTML모드로 변환

이제 차이점이 확연하게 보입니다. 모든 단어와 단어 사이의 공백마다   라는 HTML태그가 삽입되었습니다. 그리고 줄바꿈이 이루어지는 방식도 변했죠. 기본모드에서 봤을 때에는 똑같아 보이는 겉모습이었지만, HTML 모드에서 봤을 때는 상당히 다른 상태입니다.

nbsp 태그의 뜻

그렇다면 저 nbsp가 무엇이길래 붙여넣기 후에 갑자기 나타났을까요? '&nbsp'는 HTML에서 공백을 나타내는 태그입니다. 게시물이 완성되고 나면 읽는 사람 입장에서는 그냥 띄어쓰기 된 것으로 보입니다. 챗GPT의 답변을 복사, 붙여넣기 해 오는 과정에서 글에 포함된 공백들이 nbsp태그로 변환되는 바람에 이렇게 입력되는 것입니다.

 

챗GPT 글을 블로그에 그대로 복사 붙여넣기 하지 않는 이유

그런데, 여기서 기본적인 의문점 하나가 생깁니다. 띄어쓰기 대신 nbsp가 붙는 건 알겠는데, 그게 있으면 안되냐는 거죠.

 

물론 저게 붙었다고 당장 큰일이 생기지는 않습니다. 그냥 무시하고 작성완료 하셔도 사람이 읽는데에는 아무 문제 없고, 원한다면 그렇게 해도 됩니다. 다만 그렇게 작성한 경우, 해당 게시물이 검색엔진에 노출되기에 불리한 요소로 작용할 수 있다는 점을 고려하는 것입니다.

 

우리가 게시물을 작성하며 블로그를 운영하고 있으면, 검색엔진 봇이 주기적으로 블로그를 방문하며 게시물의 정보를 수집해갑니다. 그리고 게시물을 검색 결과에 노출시키기 전에 자신이 미리 읽어보고, 검색 결과에 노출하기 적절하며 가치있는 게시물인지 판단하고 점수를 매겨서 상위노출 우선도를 정합니다.

 

그런데 검색엔진이 게시물을 판단할 때, 한 블로그에 2000자, 3000자 짜리 긴 글이 3분 간격으로 작성되었고, 글자 사이 공백은 그냥 스페이스바 누르면 되는걸 &nbsp 태그 수백개를 사용해서 공백을 만들었고, 마침 최근 챗GPT 때문에 이런 식으로 양산된 글이 인터넷에 범람중이라면 어떻게 판단할까요?

 

검색엔진 봇은 양질의 글을 판단해내기 위해 검색포털에 의해 지속적으로 업데이트 되기 때문에, 이런 요소들이 식별되면 챗GPT에 의해 생성된 문장을 그대로 복사해왔다고 판별해낼 수 있을 가능성이 높다는 것입니다. 그리고 이렇게 양산형 게시물을 계속 만들어내는 블로그라고 인식되면, 블로그 자체를 신뢰할 수 없다고 판단할 수 있습니다.

 

이 때문에 기본적으로 챗GPT 글을 블로그에 그대로 복사, 붙여넣기 해서 포스팅을 작성하는 것은 추천하기 어렵습니다. 다만 그래도 챗GPT의 글을 적극적으로 활용하기를 원하시는 분들을 위해 이 nbsp 태그를 쉽게 제거하는 방법을 다음 포스팅에서 알려드리겠습니다.