Added pre processed version 1.0 to clean up data set and produce a n… #3

shivanshuk · 2020-05-03T19:18:45Z

Added some part from Milestone 1:

Reading the data set
Creating a master regex as per the data set
removing unwanted data from the dataset
replacing the unwanted data as per regex
cleansing the data set
total 8500 * 4 shape gathered and converted
replaced all junky characters, emails, body text, cid images etc from data set
saved processed data v1.0 under the datasets folder.

…ew data under datasets

shivanshuk · 2020-05-03T19:19:44Z

@rgnanas
@SrikanthEnuguru
Please check and review the same

Added pre procession version 1.0 to clean up data set and produce a n…

3330e4b

…ew data under datasets

shivanshuk marked this pull request as ready for review May 3, 2020 19:18

shivanshuk changed the title ~~Added pre procession version 1.0 to clean up data set and produce a n…~~ Added pre processed version 1.0 to clean up data set and produce a n… May 3, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Added pre processed version 1.0 to clean up data set and produce a n… #3

Added pre processed version 1.0 to clean up data set and produce a n… #3

Uh oh!

shivanshuk commented May 3, 2020

Uh oh!

shivanshuk commented May 3, 2020

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Added pre processed version 1.0 to clean up data set and produce a n… #3

Are you sure you want to change the base?

Added pre processed version 1.0 to clean up data set and produce a n… #3

Uh oh!

Conversation

shivanshuk commented May 3, 2020

Uh oh!

shivanshuk commented May 3, 2020

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants