작은 프로젝트를 진행해 보려고 한다.
검색엔진은 보통 정보수집 -> 가공 -> 검색으로 이루어지는데
정보수집 과정에서 웹의 정보를 크롤링을 이용해 정보를 모은 다음 정보를 색인작업을 거쳐 사용자가 검색을 할 수 있게 만든다.
하지만 너무 웹 봇을 만들 실력은 아직 부족하기에 일련의 과정을 간단하게 따라 하기로 해보자!
먼저 만들어 볼 것은 웹 크롤링이지만 아직 실력이 부족하기에 txt 파일을 미리 저장해 이것을 웹 페이즈로 생각하고 문자를 모아보자!
일단 먼저 파일을 불러와야 하므로 불러오는 방법을 찾아봤다.
https://www.cplusplus.com/reference/
Reference - C++ Reference
www.cplusplus.com
C++ reference에서 들어가자마자

딱 이런 것이 눈에 보이길래 신기해서 자세하게 봤다.
C++에서 제공하는 입/출력 라이브러리 관계 구성도 같았다. 내가 사용하고 있는 라이브러리가 이렇게 구성되고 있다는 것을 처음 알게 되었다. 나중에 좀 더 공부하기로 생각했다.
일단 여기서 사용한 함수는 getline()이다.

이것을 보니
1.getline(char*s, streamsize n);
2.getline(char*s, streamsize n, char delim);
1. 번은 \n를 만나면 데이터를 뽑아오고,
2. 번은 delim을 기준으로 데이터를 뽑아오는 것 같다.


잘 뽑힌 것 같다.
이제는 데이터를 가공할 차례이다. 어떻게 가공할지가 고민이다....
'문제해결 및 코드 만들기' 카테고리의 다른 글
| 2022-01-20(개인 프로젝트) 시간 단축 (0) | 2022.01.20 |
|---|---|
| 2021-12-13 비밀번호 만들기 (0) | 2021.12.13 |
| 2021-10-12 (회고록) 체스 게임 객체지향적 설계연습 (0) | 2021.10.12 |
| 2021-07-29 조그마한 개발 일기(3) (0) | 2021.07.29 |
| 2021-07-19 조그마한 개발 일기(2) (0) | 2021.07.19 |