작은 프로젝트를 진행해 보려고 한다.

검색엔진은 보통 정보수집 -> 가공 -> 검색으로 이루어지는데

 

정보수집 과정에서 웹의 정보를 크롤링을 이용해 정보를 모은 다음 정보를 색인작업을 거쳐 사용자가 검색을 할 수 있게 만든다.

 

하지만 너무 웹 봇을 만들 실력은 아직 부족하기에 일련의 과정을 간단하게 따라 하기로 해보자!

 

먼저 만들어 볼 것은 웹 크롤링이지만 아직 실력이 부족하기에 txt 파일을 미리 저장해 이것을 웹 페이즈로 생각하고 문자를 모아보자!

 

일단 먼저 파일을 불러와야 하므로 불러오는 방법을 찾아봤다.

https://www.cplusplus.com/reference/ 

 

Reference - C++ Reference

 

www.cplusplus.com

C++ reference에서 들어가자마자 

 

딱 이런 것이 눈에 보이길래 신기해서 자세하게 봤다.

C++에서 제공하는 입/출력 라이브러리 관계 구성도 같았다. 내가 사용하고 있는 라이브러리가 이렇게 구성되고 있다는 것을 처음 알게 되었다. 나중에 좀 더 공부하기로 생각했다.

 

일단 여기서 사용한 함수는 getline()이다.

 

이것을 보니

1.getline(char*s, streamsize n);

2.getline(char*s, streamsize n, char delim);

1. 번은 \n를 만나면 데이터를 뽑아오고,

2. 번은 delim을 기준으로 데이터를 뽑아오는 것 같다.

잘 뽑힌 것 같다. 

이제는 데이터를 가공할 차례이다. 어떻게 가공할지가 고민이다....

+ Recent posts