'섭섭의 기록/지나온 길' 카테고리의 글 목록

섭섭의 기록/지나온 길

섭섭이는 무엇을 해왔는가?(3)

seobbseob 2021. 7. 6. 16:36

2021. 7. 6. 16:36

휴먼 러닝은 무엇을 해왔는가?(2) 3줄 요약
1. 경제학에서 계량으로 데이터를 분석하는데 재미를 느낌.
2. 머신러닝을 알게 되고, 공모전에 나가서 경험을 쌓음.
3. 취업준비를 하려고 하는데, 친구들과 창업의 이야기를 나눔.

Chapter. 4 스타트업

시작

나는 그날 토익 공부를 하고 있었다.
800점은 넘어야 이력서에 쓸 수 있지 않을까 하는 생각이었다.

(그 당시 점수 = 735점)

스터디 카페에서 공부를 하다가 친구들이 잠깐 얼굴을 보자는 말에 술을 한잔하러 갔다.
거기에는 나처럼 창업에 관심이 많은 친구들이 있었는데, 한 친구는 창업을 시도하다가 피봇팅 방향을 고민하고 있었다.
이런저런 아이디어들을 던지다가, 한 친구가 스타일링 서비스는 어떠냐고 아이디어를 냈다.

스타일리스트들은 저임금에 열악한 노동환경에 놓여있고, 소비자들은 의류 구매에 어려움을 느낀다.
이 둘을 이어서 플랫폼을 만들고, 나중에는 의류 브랜드도 입점시키면 좋지 않을까? 이런 이야기를 하였다.
거기에 있던 친구들은 좋은 아이디어라고 생각을 했고, 그다음 날부터 스타트업은 시작되었다.

사무실 알아보기

여러 곳의 사무실을 찾아보았다.
어플로 사무실을 알아본 뒤, 괜찮아 보이는 곳을 뽑아 리스트를 추려 방문해보았다.
상봉역, 군자역, 성수역까지 총 5곳의 공유 오피스를 가보았고 그중에서 저렴하면서 좋은 상태의 사무실에 들어갔다.
성수라서 위치도 좋았다.
스타트업 시작부터 사무실에 들어갈 때까지 일주일 정도 걸렸다...

4인실인데 커피 머신도 있고 꽤나 괜찮은 사무실, 멀리 롯데타워도 보인다.

내가 했던 일 : 1. 상품 추천을 위한 수집 데이터, 모델 선정

나는 여기서 AI 리서처를 했다.(?)
말만 거창하지 추천 시스템에 대해서 아는 것도 없고, 수학도 리서처들보다 엄청 못해서
"어떻게 해서든지 초기에 문제가 없을 만큼 추천 시스템을 만들어 놓으면, 그다음은 고도화는 내가 공부를 더 해서 하거나 누군가 와서 해주겠지?"
이런 생각으로 추천 시스템에 대해서 공부를 했다.

고도화 과정에서 문제가 없으려면 모아놓은 데이터가 문제가 없어야한고 생각했다.

그래서 사실 추천 시스템보다는 수집 데이터를 선정하는데 공을 들였다.

책임감이 강한 나로서는 나때문에 팀에 문제가 생기는 것을 극도로 싫어해서, 이때 스트레스를 엄청 많이 받았다.
내가 능력 이상의 일을 맡으면 어떻게 해서든지 결과를 만들긴 하지만, 스트레스를 많이 받는다는 것을 처음 알았다.
정말로 내 인생에서 가장 힘들었던 순간이 언제냐 물어보면, 난 이때라고 바로 이야기할 수 있다.

여기서 수집 데이터는 이야기하고 싶지만 나 말고 다른 친구들이 진행 중인 스타트업이라서 언급은 하지 않겠다.

서비스의 초반에는 이용자도 많이 없고, 추천할 상품들도 많이 없을 것이라 생각해 고객 데이터 기반 추천과 Contents based filtering이 잘 작동할 것이라 생각했다.

그 이후에 어느 정도 상품과 고객이 생기고 행동 데이터가 많아지고 나서는, 카테고리컬한 데이터가 많은 특성을 고려하여 FFM으로 추천할 생각을 했다.

그 이상의 딥러닝 기법들은 MAU를 고려했을 때 도입할 수 없을 것이라 생각했다.
(내가 잘 모르기도 한다...)
이 모델들은 로컬에서 학습시킨 뒤, AWS EC2에 모델만 올려 예측만 시키게 만들거나 배포에 문제가 생긴다면 Sagemaker를 이용하여 학습 및 배포를 시키려고 했다.
만약에 추천에 정말 실패했을 경우, AWS의 Personalize를 사용하려 했다.

이렇게 이야기하면 되게 간단해 보이는데, 아예 개념이 없는 상태라 정말 애를 먹었다.
저 생각을 하는데 2달 정도 걸렸다.....

한 가지 모델을 배우려면 수학적인 것도 중요하지만 직접 데이터에 실험해보는 것이 중요하다고 생각한다.
하지만 이 때는 고객은커녕 어플도 없었고, 실험할 것이 없었다.
그래서 Recsys 대회에 나왔던 문제들 중에서 커머셜 데이터를 자주 사용했었다.
그래도 그 데이터는 우리 데이터가 아니고 내가 쓰려는 피쳐들과는 아예 다르고 고객도 다르기 때문에 큰 의미는 없어 보였다.
그냥 답답한 하루하루를 보내고 있었다....

추천 시스템에 대해서는 위처럼 계획을 세워 놓고, 새로운 할 일을 찾았다.

내가 했던 일 : 2. App 프론트 엔드 개발 및 Web MVP 모델을 위한 프론트 백엔드 서버 구축

App 프론트 엔드 개발

추천 시스템을 하면서 스트레스를 정말 많이 받았는데, App 프론트엔드를 만들면서는 좀 괜찮아졌다.
어도비로 시안을 그려오면 내가 Reactnative로 옮겼다.

처음에 자바스크립트를 배우면서, 이 언어는 정말 파이썬이랑 너무 다르다고 생각이 들었다.
파이썬은 위에서 아래로 순서대로 실행되는 반면, 자바스크립트는 한 번에 실행이 된다.
그래서 위에서 변수를 할당해도 밑에 있는 코드가 동시에 실행되어 값이 비었다고 에러가 나는 경우가 있다.
이 특성을 비동기라고 하던데, 아직도 난 이해를 하지 못했다.

하지만 리액트 네이티브로 화면을 만들기에는 어렵지 않은 작업이었다.
코딩으로 그림을 그리는 느낌이었다.
(물론 100프로 어도비와 똑같은 그림이어야 하지만)

Web MVP 모델을 위한 프론트 백엔드 서버 구축

[성동-HYU 예비 창업 패키지]에서 발표심사를 받기 전에 MVP 테스트를 진행해야 했고, 내가 개발에 관한 모든 과정을 맡아서 진행했다.
프론트엔드는 리액트로 만들었고, 백엔드는 AWS의 EC2와 RDS의 조합으로 만들었다.
이 과정에서 AWS는 스타트업을 하는 데 있어서, 없으면 안 될 요소라는 것을 몸소 느꼈다.
그리고 UI/UX에 대해서 다시금 생각하였다.
전에 빅콘테스트 공모전 POC에서 만든 어플 화면에 좀 더 신경을 썼으면 어땠을까 생각이 들었다.
(그때 내가 만든 화면이 아니라서 이런 말은 사실 하면 안 된다.....)

저 화면 하나를 만드는데 글자도 이것저것 써보고, 위치도 여기저기 바꿔보았다.
상품에 대한 정보의 수도 줄여보고, 늘여도 보고, 글자 크기도 바꿔보고 여러 가지를 하였다.
소비자들이 어떻게 하면 더 편하게 볼 수 있을까?
어떻게 하면 더 좋은 경험으로 다가올 수 있을까?
고민을 많이 했다.

그러면서 고객에 대해서 고민하는 것이 재미있다는 것을 느꼈었다.
이후에 이 계기로 그로스 해킹에 대해서 관심을 가지게 되었고, 고객들이 들어오면 그로스 해킹을 해보고 싶다는 생각을 했다.

[성동 HYU 예비 창업 패키지] 선정

예비 창업 패키지가 안됐으면 시간을 좀 버렸네 싶었을 텐데, 그래도 선정이 되어서 아예 가능성 없는 일을 하지는 않았구나 생각했다.
하지만 나는 패키지가 되던 말던, 나갈 생각을 하고 있었다.
고객층에 대한 의심, 스타일리스트에 대한 의심, 데이터 사이언티스트로서의 나 자신에 대한 의심이 이유였다.

좋은 경험이었다.
재미난 생각들을 현실로 옮기려는 시도였고, 그 과정에서 배우는 것들이 많았다.
그중에서도 가장 크게 배운 것은
나는 스타트업에 남아야 할 사람이고, 아직은 공부할 것이 많다는 것이다.
라는 것이다.

버는 돈 없이 내가 가진 돈을 다 쓰면서도 세상에 필요하다고 생각한 서비스를 새벽부터 밤까지 만들어가는 과정이 즐거웠고, 살아있음을 느꼈다.

그 이후

휴식기를 가졌다.
여행도 다녀오고, 그냥 누워있기도 했다.
스타트업을 할 때 바쁘게 살아서인지, 뭔가 좀 해야할 것 같은 기분이었지만 쉬었다.

그러다가 어느 순간 이제 쉬는 것도 재미없다고 느껴질 때, 공부를 시작했다.
통계 공부도 다시하고, 계량 공부도 하고, 모델링도 보는 중이다.
SQL도 공부하고, 개인 프로젝트도 하나 할 예정이다.
(바빠 보이는데, 조금씩 하고 있어서 안 바쁘다.)

그리고 4-2학기를 다니고 졸업을 할 것이다.
더 나아가 스타트업에서 데이터를 하는 사람이 될 것이다.

누가 이 글을 읽을지는 모르겠지만, 여기까지 읽었다면 내 20살부터 27살까지의 인생을 보았다.
나에 대해 어떻게 생각할까?

다음에 이 카테고리에 글을 쓸 때쯤에는 난 어디서 뭘 하고 있을지 궁금하다.
지금보다 더 멀리 나아갔기를 바랄 뿐이다.

20~27살 끝

'섭섭의 기록 > 지나온 길' 카테고리의 다른 글

섭섭이는 무엇을 해왔는가?(2) (0)	2021.07.06
섭섭이는 무엇을 해왔는가?(1) (0)	2021.06.12

섭섭이는 무엇을 해왔는가?(2)

seobbseob 2021. 7. 6. 13:29

2021. 7. 6. 13:29

휴먼 러닝은 무엇을 해왔는가?(1) 요약

경제학이 재미있어 보여, 경제학과에 갔다가 흥미가 떨어져 패션 과목을 들어봤음.
패션이 재미있어, 패션 학원과 패션 스타트업 과목을 거치며 나는 옷을 팔아야 하는 사람이라고 판단.
그 후 패션 이외의 재미난 것을 찾으러 다니는데...

Chapter 3. 데이터 과학

(엄청 발전한 척하지만 지금보면 오른쪽 보고서도 문제가 많다...)

계량경제학과 화폐금융이론

스타벅스 텀블러를 만든(?) 3학년 2학기에 들은 다른 과목, 계량경제학...

이전까지 배웠던 경제와는 완전 다른 신세계였다...

(한번 놓치면 종강때까지 아무것도 못하는 수업이다...가슴이 웅장해진다...)

경제 분석을 위한 도구를 배우는 과목이라 그런지 경제 이야기는 하나도 안 나오고 통계에 대해서만 배웠다.

교수님께서도 학생들이 어려워하는 것을 아셔서 그런지 기초부터 다시 가르쳐주셔서 재미있게 들었던 수업이다.

다만, 이 수업을 들으면서 생각난 과목이 있었다.

그 과목은 화폐금융이론인데, 그때는 기초 통계밖에 몰라서 아예 틀린 보고서를 쓴 것으로 기억한다.

주제는 금 가격 결정요소와 실증분석이었다.

(회귀 분석의 원리, 회귀 분석시 유의할 점도 몰랐고, 회귀 분석표도 무슨 의미인지 몰랐다고 한다...)

계량 경제학을 수강하면서, 계속 그 잘못된 보고서가 떠올라서 계량 경제학 보고서로 화폐금융이론의 보고서를 보완하여 제출하였다.

(보완은 했지만, 시계열 특성은 반영을 하나도 못했다... 그래도 전보다 더 나은 것을 제출해서 뿌듯했다고 한다😋)

그 과정 동안, 정말 재미도 있었고 내 나름대로의 분석을 하는 것에서 성취감이 느껴졌다.

이렇게 고전적인 데이터 분석 방법을 조금이라도 알게 되니, 학기가 끝나고 데이터 분석을 위한 더 좋은 방법이 알고 싶어 졌다.

패션 대신하고 싶은 일이 생긴 순간이었다.

그리고 내 옆에는 데이터 과학을 일찍부터 시작한 동기가 있었다.

"머신러닝 하지마."
"그게 뭔데."
"머신러닝 하지말라고."
"그거 어떻게 하는건데."

핸즈온 머신러닝과 스타크래프트 승률 예측 공모전

동기는 딜리버리 히어로에서 인턴을 하고 있었다.

그 당시에 공대의 데이터 마이닝 수업도 듣고, SAS 데이터 분석 공모전에서 입선도 했던 친구이다.

내가 머신러닝을 시작하려면 어떤 책을 봐야 하냐고 물었을 때, 핸즈온 머신러닝을 추천해줬다.

그날 바로 책을 구입하고, 책을 보는데 재미있는 내용이 정말 많았다.

머신러닝이 왜 필요한지, 분류와 회귀의 과정, 선형 회귀, SVM, 트리 모델 등 새로운 것들을 많이 배웠다.

(뒷부분은 딥러닝인데, 동기가 뒷 부분은 내용이 좋지 않다고 해서 안 읽었는데 읽어볼 걸 그랬다.)

그렇게 이 책을 몇 번씩 보며, 책에 파이썬이 나와서 점프 투 파이썬을 공부하였다.

조금씩 이제 책에 나온 예제가 아니라 무언가 해보고 싶다는 생각이 들 때쯤, 동기들이 공모전을 나가자고 제안을 했다.

공모전의 풀네임은 행동 데이터 분석 인공지능 AI 경진대회인데, 그냥 스타크래프트 승률 예측 공모전이다.

(이름은 정말 거창하다.)

이 공모전은 간단히 요약하면 다음과 같다.

스타크래프트 게임에 Player1과 Player2가 존재.
이 둘은 게임 동안 행동(ex. 지도에서 특정 지역을 보기, 유닛 뽑기, 유닛 이동 등)을 함.
이 행동들은 행동 로그로 남아있으며, 경기 시작 후 10분까지 만의 정보로 승자 예측.

책만 보고 나는 내가 다 안다고 생각했으나, 공모전을 시작하니 아무것도 모른다고 생각이 들었다.

책은 쉽게 시각화도 하고 모델링도 하던데, 나는 하나도 쉽게 할 수가 없었다.

코딩 자체에 익숙지 않았고, 다양한 시각화를 본 적이 없고, 스타크래프트도 잘 몰라 피쳐 생성에도 인사이트가 떨어졌다.

게다가 해당 시점의 플레이어의 행동이 줄글로 주어져, 정규표현식을 써야 해서 더욱 어려웠다.

그래도 패션학원에서와는 다르게, 같이 고민할 수 있는 팀원들이 있어서 힘들어도 재미있었다.

모델 학습시켜 놓고 점심 먹으러 가면 밥 먹는 내내 모델 성능이 기대가 되었고, 새로운 아이디어가 떠오르면 그 아이디어는 모델 성능에 얼마나 영향을 줄까 궁금했다.

반면 기대와는 다르게 모델 성능이 더 떨어지거나, 이전과 비슷한 성능을 내면 아쉬웠다.

그렇게 대회가 끝나고 18등(94팀 중)을 기록했다.

https://github.com/seobseobseobseob/DACON_StarCraft

데이콘 스터디

4학년 1학기 중간고사쯤에 동기들에게 2020 빅콘테스트에 나가자고 이야기를 하였다.

결과에 상관없이 데이터 공모전을 한번 맛보니, 입상에 대한 욕심이 났다.

다른 사람들이 얼마나 머신러닝을 잘하는지, 내 수준이 어디인지도 궁금했다.

동기가 나포함 3명이었고, 빅콘테스트 공모전은 5명까지 한 팀으로 나갈 수 있었다.

경제학과 3명이라 팀 자체가 코딩에는 약한 편이었다.

그래서 우리 학교 컴공에서 한 명 정도를 뽑기로 결정했다.

에브리타임과 학교 홈페이지에 구인 글을 올렸고, 생각보다 뜨거운(?) 반응이 있었다.

3~4명의 사람들이 문의를 해왔었는데, 컴공과 연구실에서 학부 연구생으로 있던 학우를 팀원으로 함께 하게 되었다.

공모전에 나가기에 앞서, 팀원들끼리 스터디를 하기로 했다.

월수금 저녁 8시에 하루에 한 사람씩 하나의 데이콘 공모전에서 1, 2, 3등의 코드 중 하나를 골라 리뷰하고 질의응답하는 형식으로 진행하였다.

그렇게 7주 동안 7개의 공모전의 1, 2, 3등의 코드를 보았다.

(중간에 리뷰하기 애매하다고 판단된 것들은 건너뛴 것들도 있다.)

(ex. 파이썬이 아닌 다른 언어로 진행한 경우...)

스터디를 하면서, 내가 맡은 수상작이 어려울 때는 스트레스를 많이 받기도 했지만 팀원들에게 받은 만큼 나도 주고 싶어서 어떻게든 책임을 지고 공부해서 리뷰를 했다.

그래서 지금 생각해보면 능력 이상의 것에 도전하다 보니 이때 실력이 많이 늘었던 것 같다.

수상자의 솔루션을 보며 파이썬의 모르던 내장 함수를 배우기도 하고, 시각화의 기술, 피쳐를 생성하는 아이디어를 얻었다.

신기한 것은 좋은 분석을 보았을 때도 많은 것을 배웠지만, 나쁜 분석을 보았을 때 더 많은 것을 배웠다.

나쁜 분석을 보며, 왜 이 방법이 틀렸고 이 방법보다는 왜 다른 방법을 쓰는 게 더 타당했는지 많이 생각했다.

그렇게 7주가 지나고 2020 빅콘테스트가 얼마 남지 않았다.

2020 빅콘테스트

빅콘테스트는 한국에서 대학생들이 참가하기에 적당한 가장 큰 대회인 것 같다.

이 대회는 한국정보화진흥원에서 주최하며, 데이터 분석 분야와 혁신 아이디어 분야로 나누어진다.

데이터 분석 분야의 경우, 어떠한 타겟값을 맞추거나, 목표 지표를 극대화하는 모델링을 제시하는 것이 대회의 큰 틀이다.

반면, 혁신 아이디어 분야의 경우, 다양한 주관 기업들의 데이터를 제공받아 새로운 비지니스 아이디어를 제시하는 것이 대회의 큰 틀이다.

참가 분야

데이콘 스터디에서 공부했던 것은 데이터 분석 분야의 틀과 비슷했고, 따라서 데이터 분석 분야의 퓨쳐스 리그에 참가하려했다.

하지만 주제가 발표된 뒤 좀 당황스러웠다...

2020년의 퓨쳐스 리그 주제는 KBO 정규시즌 팀별 승률, 타율 및 방어율(평균자책점) 예측이었다.

제공 받은 데이터는 2016년~2020년(~7/20)까지의 경기별 결과 및 팀/선수 기록이고, 예측해야하는 타깃은 대회 종료 이후 경기의 값들이었다.

다시 말해서, 학습 데이터의 피쳐를 그대로 타깃에 사용할 수 없다는 것을 의미한다.

(미래의 경기에 누가 언제 나오고 상대 선수로 누가 나올지 등은 현재 시점에서 알 수 없다.)

이러한 제약 조건이 부담스러웠다.

그리고 챔피온리그에 나가기에는 입상하기에 실력이 부족하다고 생각이 들었다.

남은 분야는 이노베이션 분야인데, 이 분야는 위에서 서술한 것처럼 지금까지 데이콘 스터디에서 공부해온 것과는 좀 다른 느낌의 대회였다.

그래도 챔피온리그에 나가는 것보다는 이노베이션 분야에 나가는 것이 입상 확률이 더 높다고 판단했고, 실제로 나중에 필드로 나갔을 때, 데이터 분석가로서 더 많이 접하게 되는 일은 이노베이션 분야에서 요구하는 분석과 방향이 비슷하다고 생각했다.

따라서 이노베이션 분야에 나가기로 결정했다.

주어진 문제 및 데이터

빅콘테스트 공식 홈페이지에 있던 이노베이션 분야의 주제는 뉴노멀 시대 준비를 위한 서비스 아이디어 및 POC(Proof Of Concept) 결과 제시이다.

구체적으로 말하면, 주어진 데이터로 코로나 19로 인한 사회적 영향력을 분석 및 예측 모델링하고, 이를 통해 초기 비즈니스 아이디어를 제공하는 것을 의미한다.

주어진 데이터는 유동인구데이터(SK텔레콤), 카드매출데이터(신한카드), SNS데이터(와이즈넛), 유통데이터(GS리테일), 물류데이터(CJ올리브네트웍스)이다. 이 밖에 팀 자체에서 수집한 외부 데이터는 날씨, 거주인구통계, 일별 코로나 확진자 수이다.

분석 주제 및 TimeLine

우리 팀은 코로나 19 확진자 수가 사람들의 이동량에 영향을 끼쳐, 그 결과 얼마나 소비에 영향을 끼치는가를 주제로 데이터를 분석하였다.

초반에 이러한 방식의 분석을 해본 적이 많지 않다보니, 많은 시행착오를 겪었다.

이 공모전은 기간이 2달인데, 그 기간을 정리하면 다음과 같다.

1 week - EDA 및 목표 설정, Word Cloud 구현 (소비에 관한 내용으로 결론을 내기로 결정)
2 week - 지역 군집화 (파생변수 생성 + 군집화가 잘 되었는지에 대한 검증)
3 week - 매개효과 모델 (매개효과 논문 스터디 + 부트스트래핑 구현) (코로나 19 확진자 수가 이동량에 영향을 주어 소비가 변한 지역만 추출)
4 week - 부분상관계수 (20년과 19년의 소비패턴의 움직임이 같았음에도 불구하고, 우연히 코로나 19 확진자 수의 움직임이 20년 소비에 영향을 준 것처럼 보이는 지역 제외)
5 week - 모델링 (다중 회귀 분석으로 코로나 19 확진자 수가 각 지역의 소비에 유효한 영향을 주었는가 검증)
6 week - POC 아이디어 구체화
7~8 week - PPT 제작 및 코드 정리

데이터 분석 부분

생각보다 지역 군집화에서 많이 힘들었고, 매개효과 모델과 부분상관계수에서는 모르던 개념이지만 공부를 하니 그렇게 어렵지 않게 이해 및 적용했다.

지역 군집화는 두 가지 파생변수를 통해 2개의 축으로 진행하였고, 파생변수는 인구유입률(유동인구/거주인구)과 1인 구매력(카드매출건수/생활인구)이라는 변수를 만들었다.

위의 변수의 값으로 시각화를 하였을 때, 2개의 축에서 비슷한 값을 갖는 지역이 많아서 군집화를 시도하는 데 어려움을 겪었다.

그래서 생각한 방법이 각각의 축의 값으로 순위를 부여하고 이것으로 군집화를 하는 방법이었다.

이렇게 진행한 결과, 지역들의 분포를 퍼트려 군집화를 진행할 수 있었다.

매개효과 모델은 X라는 독립변수가 어떻게 Y라는 종속변수에 영향을 끼치는가 설명할때 쓰이는 모델이다. 이를 이용하여 코로나 19 확진자 수가 사람들의 이동량을 변화시켜, 사람들의 소비에 영향을 끼쳤던 지역을 추출하였다.

그리고 추출된 지역 중에서 부분상관계수를 이용하여 정말로 우연히 코로나 확진자 수의 움직임과 20년의 소비가 관련이 있었던 지역을 제거하고, 다중회귀분석을 이용하여 오프라인 소비에 대한 모델링을 진행하였다.

POC 부분

POC는 공모전에서 제출할 수 있는 뻔한 것(어느 기업을 겨냥한 비즈니스 아이디어)보다는 실제로 비즈니스를 할 수 있는 것을 제출하고 싶어서 고민을 많이 했다.

우리의 POC는 '선결제 후구매' 플랫폼. 코로나 확진자 수가 늘어날 때, 자영업자들은 영업제한으로 인해 손해가 컸고, 자금조달이 힘든 상황이었다.

반면 소비자들의 소비 추세는 코로나 확진자 수 추세와 반대의 방향으로 움직였고, 소비가 늘어날 때에는 2019년 동시점만큼 소비를 회복하기도 했다.(오프라인 기준)

우리 팀은 자영업자들은 자금이 필요하고, 소비자들은 안전한 소비가 필요하다는 점에서 착안하여, 코로나 확진자 수가 많을 때는 온라인 선결제하여 할인된 가격으로 쿠폰을 구입하고, 코로나 확진자 수가 적을 때는 선결제한 쿠폰을 오프라인에서 이용하는 흐름의 비즈니스 아이디어를 구상했다.

또한 앞에서 진행한 모델링으로 자영업자들에게는 미래의 매출에 대해서 참고지표를 제공하고, 가게마다 거리두기 지킴 현황라는 것을 제공하여 소비자들에게 안전한 오프라인 소비에 대한 참고지표를 제공하여 플랫폼을 사용할 유인을 더욱 늘리려 시도를 하였다.

예선 통과가 가능했던 이유

내 생각에 우리 팀이 예선을 통과한 이유는 분석의 단계마다 단순히 당연히 그렇게 되었겠지라는 식의 전개를 하지 않고, 통계의 도구를 통해 검증을 했기 때문이라고 생각한다.

그 검증을 요약하면 다음과 같다.

전통적인 인식에 있는 지역 분류가 있겠지만 -> 그것보다는 데이터를 통해 지역 분류를 하기 위해 파생 변수 생성 및 군집화
코로나 19가 당연히 소비에 영향을 끼쳤을 것이라 생각하지만 -> 그것보다는 어떠한 경로로 코로나 19 확진자 수가 소비에 영향을 끼쳤는지 설명하기 위해 매개효과 모델 사용
20년과 19년의 소비 패턴이 같았음에도 불구하고 우연히 코로나 19 확진자 수와 연관있는 지역을 시각화로 확인해서 분석에서 제외할 수 도 있겠지만 -> 부분상관계수라는 틀을 이용해 객관적으로 그러한 지역을 제외

위의 세 가지 검증이 우리 팀의 키포인트였다.

입상을 하지 못한 이유

본선에서 발표를 했으나 상을 받지 못한 이유는 두 가지라고 생각한다.

지루할 수 있는 분석 진행 - 전염병의 확진자 수가 사람들의 이동량에 영향을 끼쳐 소비 패턴이 변화하였다. 이를 통계로 증명하였으나, 누구나 추론 가능하다. 더 재미있는 분석을 진행했다면 어땠을까? (ex. 코로나 확진자 수 예측) 혹은 조금 더 최신 기법을 사용했다면 어땠을까?(관측치가 적어 불가능했을 것이긴 하다.) 발표 순서가 마지막이었는데, 임팩트있게 심사위원분들의 머릿 속에 남기에는 다소 지루한 분석의 진행이었다. 그래서인지 분석과정에 대해서는 아무 질문도 하시지 않았다.
주관사에게 매력적이지 않은 POC - 위에서 실제로 비즈니스가 가능한 POC를 제공하기 위해서 어느 기업을 타깃으로 POC를 구성하지 않았다고 했는데, 그것이 상을 못 받은 원인이 아닐까 싶다. 기업들에서 나온 팀장님들이 심사위원으로 많이 있으셨는데, 본인들이 몸담고 있는 회사에서 바로 쓸 수 있는 POC가 더 흥미롭고 좋아보이지 않았을까 생각이 든다.(이건 내 개인적인 생각이다. 아닐 수도 있다.)

발표 후 Q&A

우리 팀은 POC에 대해 두 가지 질문을 받았다.

Q: '카카오 기프티콘'과 휴먼러닝의 '선결제 후구매'는 어떻게 다른가? - A: 카카오 기프티콘의 경우, 프렌차이즈와 같은 기업들을 상대로 비즈니스를 하는 반면, 우리의 선결제 후구매는 골목 상권까지 비즈니스의 대상이다. 또한 결제의 정산 주기도 바로 정산이라 카카오 기프티콘보다 더 자영업자들의 자금 조달에 도움이 된다.
Q: 소비자들이 재화 및 서비스의 가격이 많이 떨어지기 전까지 구입하지 않아, 시장에서 상품의 가격이 많이 떨어지면 어떻게 하나? - A: 우리의 플랫폼은 가격에는 관여하지 않는다. 자영업자들이 감내가능한 가격과 소비자들이 매력적이라고 생각하는 수준의 가격은 플랫폼 이용자들 사이에서 정해진다. 따라서 그 문제는 시장이 해결해 줄 것이라고 생각한다.

발표가 끝난 후, 든 생각

우리가 제일 마지막 발표라 다른 팀들이 발표하는 것을 지켜보았는데, 딥러닝을 들고와서 모델링을 한 팀들이 많았다. 정말 모델이 제대로 작동하는지 궁금하다. (딥러닝을 하기에 충분하지 않은 관측치이지 않았나 싶다.)

또 다른 팀에게는 어떠한 질문을 했는지 궁금하다.(질문은 들을 수 없었다.)

그래도 본선 진출만 하면 절반 조금 안되게 상을 주던데, 우리도 받을 수 있지 않을까 생각을 했다...

하지만 우리 팀은 본선 진출에서 더 나아가지 못했다...ㅜㅜ

https://github.com/seobseobseobseob/Big_Conteset_2020_Innovation

태양광 발전량 예측 공모전

그 이후 한달 정도 SQL을 공부하고 있는데, 동기가 공모전에 나가야 무언가 얻고 공부하는게 있는 것 같다고 이야기를 해왔다.

나도 그 이야기에 동의했고, 12월에 공모전을 찾다고 때마침 따끈따끈하게 대회를 연지 얼마 안된 태양광 발전량 예측 공모전을 발견했다.

이 공모전에서는 코딩도 어느정도 자유롭게 가능해서 생각한 피쳐들을 모두 생성하는 것이 가능해서 수월했다.

이렇게 피쳐를 만드는 시간을 줄여, 모델링에 더 많은 시간을 쓸수 수 있었다

생각보다 초반에는 점수가 많이 올라가 4등까지 갔었는데......

막판에 public 리더보드에서 39위까지 떨어지고, private에서는 shake-up을 당했다...

(사실 뭐 당했다기보다는 우리가 강건한 모델을 못 만든게 아닐까 싶다...)

https://github.com/seobseobseobseob/DACON_Photovoltaics

그렇게 공모전을 정리하고 슬슬 취업준비를 하려는데.......

친구들과의 술자리에서 창업에 대한 이야기를 나눈다.

다음 글에서 계속......

휴먼 러닝은 무엇을 해왔는가?(2) 3줄 요약

1. 경제학에서 계량으로 데이터를 분석하는데 재미를 느낌.

2. 머신러닝을 알게 되고, 공모전에 나가서 경험을 쌓음.

3. 취업준비를 하려고 하는데, 친구들과 창업의 이야기를 나눔.

'섭섭의 기록 > 지나온 길' 카테고리의 다른 글

섭섭이는 무엇을 해왔는가?(3) (4)	2021.07.06
섭섭이는 무엇을 해왔는가?(1) (0)	2021.06.12

섭섭이는 무엇을 해왔는가?(1)

seobbseob 2021. 6. 12. 23:35

2021. 6. 12. 23:35

블로그를 처음 만들고 처음 쓰는 글이라 솔직히 뭐라고 써야 좋을지는 모르겠다. ^^*

완벽한 초안을 써야겠다는 생각은 아예 글을 못쓰게 만든다 생각하기 때문에, 의식의 흐름대로 적어보려 한다...

지금까지 내가 해온 것들과 내 강점, 그리고 나아가야 할 길을 정리하는 형식으로 포스트를 진행해볼까 한다.

내 삶의 큰 흐름
경제학 -> 패션 -> 데이터 과학 -> 스타트업

Chapter 1. 경제학

경제학과에 다니는 나는 놀랍게도(?) 고등학생 때 사회탐구 영역으로 지리와 사회문화를 선택하였다.

그러면 경제학과를 왜 선택했냐?

신박하게도 언어 지문을 읽다가 경제학 지문을 읽었는데, 재미있어서 경제학과를 갔다.

물론 수학도 좋아했고, 문과에서 선택할 수 있는 학과 중에서는 그래도 취업이 잘된다고 해서 선택한 점도 있다.

비문학에서 읽었던 것처럼 재미난 것들을 배우러 경제학과에 갔는데...

내 예상과 다르게 경제는 재미가 없었다...

미시와 통계는 수학을 많이 쓰기 때문에 재미가 있었지만, 거시는 줄글로 된 것들을 배워서 너무 재미가 없었다.

거시는 항상 벼락치기로 시험을 준비했기 때문에, 이해도 잘 안 되고, 그저 외워서 시험을 보고 다음날 다 까먹었다.

이렇게 학점을 위해, 졸업을 위해 수업을 듣는 것이 무슨 의미가 있나 생각이 많이 들었다.

그래도 꾸역꾸역 나쁘지 않은 성적으로 경제 전공을 해나가고 있었는데, 2학년 2학기 수강신청 날 '그 과목'을 봐버렸다.

'그 과목' = 패션상품 경영

Chapter 2. 패션

패션상품 경영

패션상품 경영은 패션 트렌드를 분석하고, 이것을 공유하는 수업이었다.

(왜 과목명이 패션상품 경영인지는 아직도 모르겠다.)

어렸을 때부터 옷을 좋아해서, 사복을 입을 수 있는 체험학습 날을 좋아했고 고등학생 때는 주말에 자율학습을 하러 가는 것을 좋아했다.

컴퓨터로는 친구들이 하는 게임도 잘 안 하고, 옷만 구경할 정도로 옷을 좋아했다.

주위에 옷을 좋아하는 친구들이 많아서 대학교 때도 술자리에 가면 옷 이야기만 하다가 그 자리가 끝나는 경우도 많았다.

패션상품 경영은 이런 나에게 과목명부터 궁금증을 유발하기 충분했다.

교양학점도 많이 채워서 여유도 있었고, 내가 좋아하는 패션을 대학교에서는 어떻게 가르치나 궁금했다.

또한 패션을 좀 더 심도 있게 알고 싶기도 했다.

이 수업으로 내가 성장했다고 생각한다.

패션학과 수업이다 보니 옷을 화려하고 멋있게 입는 패디과 학생들이 많았다.

그리고 그러한 학생들은 나보다 패션에 대해서 잘 알거라 생각이 들었다.

이러한 사람들 앞에서 중간과 기말, 그리고 틈틈이 과제를 발표를 하다 보니 처음에는 날 비웃지 않을까 괜히 두렵고 그랬지만 나중에는 이 과정을 통해 나도 나름 내 지식이 있고, 나쁘지 않은 인사이트가 있다고 생각이 들었다.

그리고 이 수업으로 패션을 업을 삼아도 괜찮겠다는 생각이 들었다.

이러한 생각은 3학년 1학기까지 이어졌다...

수강신청부터 학기 끝날 때까지 '패션을 해야 되나 말아야 하나' 계속 고민했다.

이 생각에 공부는 안 했지만, 정말이지 공부를 열심히 했던 학기보다 힘들었다.

그 결과 패션 복수전공을 하기로 마음을 먹었고, 바로 2학기 때 수강신청을 해서 복수전공을 해야겠다 생각을 했다.

세상에는 옷을 사는 사람, 옷을 파는 사람, 옷을 만드는 사람이 있다.
나는 어디에 해당할까?

에스모드 서울

경제와 패션의 중간 징검다리로 나는 에스모드 서울 섬머 클래스에 등록했다.

에스모드 서울은 프랑스 에스모드 파리에서 만든 서울의 패션학원이다.

이 곳이 평이 좋고, 전문적이라는 판단을 해서 이곳에 섬머클래스에 다녔었다.

처음에는 아무것도 모르는 상태이고, 열심히 하면 되겠지라는 생각에 아침에도 수업보다 일찍 가서 준비하고, 밤늦게까지 그림도 그리고 바느질도 했다.

그렇게 2주가 지나고, 커리큘럼은 기술적인 부분을 넘어서 창의적인 부분에 대해서 나에게 요구하기 시작했다.

기술적인 부분만 생각하다가, 갑자기 창의적인 부분을 요구해서 부담감이 컸다.

섬머 클래스의 결과물을 학원은 만들고 싶었던 모양이다.

하지만 나는 의류에 있어서 창의적인 부분을 만들기에는 부족했고 준비가 안되어 있었다.

나라는 사람은 아무것도 없는 텅 빈 껍데기 같다고 느꼈다.

결국 정말 많은 고민 끝에 나는 옷을 만드는 것과 맞지 않다는 결론을 내리고 학원을 나오게 되었다.

그 이후

그래도 패션은 좋아서 수업을 하나 더 들었다.

패션 스타트업 사업계획서 작성 및 온라인 창업이라는 수업인데, 패션사업의 전반적인 내용을 배웠다.

브랜드 포지셔닝, 사업 아이템, 가격 전략 등 재미난 것들을 많이 배웠다.

패션 아이템으로서의 텀블러라는 주제로 기말 발표도 하고 점수도 좋게 받았다.

그리고 그 아이템으로 사업은 안 했지만, 몇 달뒤 스타벅스에서 비슷한 텀블러가 있었던 것을 발견했다...

(좌)목업버전 과제 텀블러 (우) 스타벅스 텀블러 (두 텀블러는 접이식이다.)

그래서 옷을 만드는 것은 나에게 안 어울리지만, 옷을 파는 것은 나에게 어울릴 수도 있다는 생각을 가진 채 패션에 대해서 더 나아가는 것은 그만두고 또 다른 길을 찾아서 고민하는데...

앞으로 휴먼 러닝은 무엇을 할 것인가?(1) 요약

경제학이 재미있어 보여, 경제학과에 갔다가 흥미가 떨어져 패션과목을 들어봤음.
패션이 재미있어, 패션 학원과 패션 스타트업 과목을 거치며 나는 옷을 팔아야하는 사람이라고 판단.
그 후 패션 이외의 재미난 것을 찾으러 다니는데...

(휴먼 러닝은 무엇을 해왔는가?(2)에서 계속...)

'섭섭의 기록 > 지나온 길' 카테고리의 다른 글

섭섭이는 무엇을 해왔는가?(3) (4)	2021.07.06
섭섭이는 무엇을 해왔는가?(2) (0)	2021.07.06

PREV 이전 1 NEXT 다음

seobbseob