selfstudy

Study project 12 15. Dez

호무리 2021. 12. 16. 05:59



어제 제출 및 발표였고 결국 저는 발표에서 개쥐1랄을 하고 말았는데요?

팀메이트가 2주 내내 제대로 팀원으로 대우하지 않고 개 쓸모없는 짓만 시킴 + 내가 짜온 코드를 무시하고 자기 버전만 고집함 + 파이널 버전 코드를 공유하지 않음 + 발표에서 내가 말할 기회를 뺏음 콤보로 존나 열받아서 발표 자리에서 폭발시킴

웃긴게 어제는 하루종일 문자며 전화며 안오더니 오늘 갑자기 보내고 전화해서 이게 미쳤나 싶었음ㅋㅋㅋ

근데 뭐하러 옹고집이랑 갑론을박하나요? 밥먹은거 아깝게
걍 바로 조교한테 토스함 무슨무슨 일이 있었고 지금 얘는 나를 본격적으로 비난하기 시작했으니 같이 일하기 너무 어렵다

이게 생각보다 좀ㅋㅋㅋ 큰일인지 조교들이랑 아마도 담당교수까지 모여서 미팅을 할거라고 함

암튼 오늘은 다음 태스크에 대해서 질문하는 자리여서 조교 앞에서 싸우진 않았고 걍 걔가 있던지 말던지 내 질문만 함

네번째 과제는
- 세번째 과제에서 뽑은 데이터셋에서 outlier를 제거하기
- outlier는 2* tor cell의 크기보다 작은 것(제거대상)
- outlier는 세가지 데이터셋에서 모두 삭제되어야함
- 제거 후 trace의 수가 15개보다 적으면 추가로 데이터셋을 생성해야한다
- median of the sum of incoming packet 계산 후 0.85*median보다 더 많이 차이나는 trace는 지운다 <<<???? 아직도 이해 못함
- 역시 다른 데이터셋에서도 같이 지워져야함
- incoming packets’ sum을 기반으로 하여 1, 2, 3 사분위수를 계산한다
- q1 - 1.5(q3 - q1) < sum < q3 + 1.5(q3-q1) 을 만족하지 못하는 trace을 지운다
- 다른 데이터셋에서도 같이 지운다
- 이 작업을 위한 어프로치가 커맨드라인의 파라미터로 작용해야함
- 터미널에서 작업 과정을 디테일하게 출력해줘야함

- 작업물에서 특징들을 추출해야하는데, 주어진 7가지 특징 외에도 패킷의 특징이 될 수 있는 것 6가지를 고민해보고 구현하기 (website fingerprinting을 할 수 있는 특징)





일단 샘플 데이터셋으로 outlier 제거까지는 햇음… 충분한 데이터셋을 갖고 있지 않아서 그것부터 뽑는 중인데 패킷캡쳐 정리 안했더니 개오래걸림 ㅋㅋ ㅋ ㅋ ㅋ ㅜㅜ.