회고 & 생각

202307 2주차 회고

안모 2023. 7. 17. 07:16

회사에서 1주일 동안 한 일

  • 주소 데이터 셋을 시도, 시군구, 지명, 도로명으로 전처리 및 분할
  • 챗봇이 문맥을 더 원활하게 이용하도록 가중치 부여


개인적으로 1주일 동안 한 일

  • 이력서 및 포트폴리오 갱신, 다듬기
  • 클린 아키텍처에 맞춰 리팩토링 진행중

회사 프로젝트에서 주소 데이터를 이용할 일이 있어서 주소 데이터 셋을 이용했다. 엄청난 양이더라, 도로명 주소만 해도 거의 14만개에 가까운 양이고 아마 지명, 시도, 시군구 다 합치면 어마어마하게 불어나지 않을까? 

 

챗봇이 문맥을 이용하는 것에 대해서는, 기본적으로 요즘 있는 챗봇 프레임워크는 컨텍스트를 지원한다. 챗봇을 전문적으로 만드는 사람은 이 컨텍스트를 정말 잘 이용할 수 있을 것이다. 지금 제작하는 챗봇은 자연어 처리를 이용하는 관계로 요구사항이 명확히 들어오지 않는다.

 

특정한 의도를 가지고 말을 하면 그 다음에 하는 말이 이전 의도의 연장인지 또 다른 의도인지 파악해야 한다. 자연어 처리는 그걸 눈치껏 맞추게 하는 장치고. 'A는 뭐에요? '라는 질문을 하고 다시 'B는요?'라는 흐름이 있다면 사람은 A를 궁금해하는 것처럼 B도 궁금해 하니 B가 뭔지 알려준다는 판단이 된다. ChatGPT같은 대형 AI 서비스도 처리가 되고.

 

지금 제작하는 챗봇은 그게 안된다. 그래서 가능한 한 유사한 효과를 얻으려 가중치를 부여하려고 한 것이다. 

 

그리고 개인사에 있어서는 이력서랑 포트폴리오를 갱신했다. 어쨌든 간에 직장생활을 해보았다는 것이 무기이니 그 무기를 활용해야 하지 않겠나? 포트폴리오는 이 프로젝트가 어떤 프로젝트인지 알려주는 것에 더해 어떻게 진행했는지 설명을 추가했다. 

 

면접관이 포트폴리오에서 궁금한 것은 '코드와 논리' 라는 말을 듣고 나서 나름 준비한 것이다.