11월 16일 삼정 KPMG 데이터 사이언티스트 특강
문과생이었던 저는 이렇게 데이터 사이언티스트가 되었습니다
변성윤
TABLO, AZURE, POWER BI
-
말도 안되는 수준으로 데이터 전문가 양성과정이 운영되고 있는데, 관리자 입장에서 역량을 판별하시는 기준이 어떻게 되나요? 포트폴리오!!!->바로투입가능
-
회사에서 데이터 전처리 가공 분석 등을 통해 최종적으로 얻고자하는 결과들이 어떤 것인지 예시를 들어 설명해주실 수 있나요??
UTF -8 , 인코딩, ASCII, IT BASIC 지식이 중요함!
-
삼정 KPMG에서 쌓아온 데이터 분석역량을 기반으로 확장 가능 한 것이 어떤 것이 있을까요?
→ 자연어처리, PDF 파일, PARSING!, 딥러닝, NRP, 개발 역량
→ 클라우드에서 이용 가능하며, 도커(데브옵스, 서버 엔지니어), pipelining,
- Kaggle competition → 꼭 활용해봐라!!
- Google cloud platform
포트폴리오를 기반으로 깃허브 커밋을 보여줘서 자랑스럽게 출석체크를 실행하도록 한다!!!! → 열정으로 승부보도록 한다!!! (깃허브, 깃랩)
파이토치가 호환이 잘된다?, 텍스트, 이미지 등을비즈니스로 하는 회사를 기반으로 보여주고, 미스매치가 안되는 경우가 매우 많다!!!
석사이상!! - > 결국 포트폴리오가 매우 중요하다!!!
수리/통계/산업공학 계열 전공자 및 석사 이상 소지자를 선호!
-
사실 첫 포지션을 어떻게 정하는지에 대해 다들 막막해하실 것으로 판단됩니다. 지금 데이터 엔지니어링, 데이터 사이언스, UI/web applications, subject matter experts가 있는데, 네 포지션중 주니어 개발자로서 추천해주실만한 포지션이 있을까요? (대부분 2년 이상의 경력개발자등을 뽑다보니 여쭤보게 되었습니다.) → 결국은 백단으로 들어가는게 낫고, 프론트는 데브옵스를 하는 것?
- 포트폴리오 : 기술 블로그를 운영하면서 매일 배운 것들을 쌓아서 자체로 보여주는 것을, 해야함!! → 깃허브도 보여주면서(IT 환경에서 일할수 있는 사람이야)
3대 황족 : 4개 국어 BM, effect engineer, 서버 엔지니어
ES engineer
REST API → 긁어오는 거!
ubuntu / linux?
- 클론 코딩!! (삼정 사이트 그대로 1시간만에 짜보기?) / 정석대로 짜는지?
포트폴리오 100장 이상으로 보여주기!!
- SNS 키워드 유사도 분석! ( 설명 할줄 알면 했다고 하는 것! )
- 각종 데이터를 시각화해서 그래프 형태로 어르신들이 보기 좋게 만들기(핵심코드등은 보여주고, 분석과정에서 유사점등을 체크해보도록 하기, 끼워 맞추기 등을 보여주기!
- 아키텍쳐 제안
- 코드는 유사하되, 컨텐츠를 나눠서,ERLC 등을 기반으로 보여주기!
- 데이터보다는 데이터를 기반으로 어떠한 분석을 하고 전력적 사고! (ERRC ) 제거 증가 감소 창조
- feature engineering
- 데이터를 섞어서 비즈니스로 보여주도록 한다!!
팀 구성 : 비즈니스 리더(상무), 팀, 인프라, 회계사, 프론트 1,2, 수준, 데이터 분석
회계쪽은 산업 전반적으로 handling 이루어 진다.!
석사는 커리큘럼 보도록!
해당 직무에서 현업에서 3년 경력 이상이 있는 경우 → 인턴을 들어가보는게 맞다고 생각이 듬!! → 2월부터 원서 쓰도록!!
→ 캐글 동메달만 따도 레코드가 매우 좋아보임! → 떨어진 썰 풀자!
- 국내에서는 데이터 엔지니어 -> 데이터 사이언티스트 -> 데이터 분석가의 단계로 점차 커리어를 바꾸게 뽑고 있는 추세일까요? 데이터 엔지니어, 데이터 분석가 정도로 구분되고 ML engineer로 나뉜다.