![]() |
ডাটা |
ডাটাঃ কম্পিউটারের আবিষ্কারের পর থেকে, মানুষ কম্পিউটারকে তথ্য বোঝাতে ডাটা শব্দটি ব্যবহার করেছে। কিন্তু এটাই একমাত্র ডাটার সংজ্ঞা নয়; এছাড়াও অন্যান্য ধরনের ডাটা আছে। ডেটা কাগজে লেখা টেক্সট বা সংখ্যা হতে পারে, বা ইলেকট্রনিক ডিভাইসের মেমরির ভিতরে বাইট এবং বিট হতে পারে, অথবা এটি এমন তথ্য হতে পারে যা একজন ব্যক্তির মনের মধ্যে সঞ্চিত থাকে।
ডাটা কি?
ডাটা হল বিভিন্ন ধরনের তথ্য বা উপাত্ত। যা সাধারণত একটি নির্দিষ্ট পদ্ধতিতে ফরম্যাট করা হয়।
একটু বিশ্লেষণ করলে দেখা যাবে, ডাটা হচ্ছে নির্দিষ্ট কোন ইনপুটের ভ্যালু বা দলীয় মান। টেকনোলজিতে ডাটা বলতে আমরা সাধারন ভাবে ধরে নিই কোন ফাইল, যেমন সেটা অডিও, ভিডিও, টেক্সটস, কিংবা অন্য কোন প্রকার উপাত্তকে।
ডাটা নিয়ে কাজ করা সহজ করতে আমরা ডাটা সায়েন্স ব্যবহার করি। ডাটা সায়েন্সকে এমন একটি ক্ষেত্র হিসাবে সংজ্ঞায়িত করা হয় যা গাণিতিক, প্রোগ্রামিং দক্ষতা, বৈজ্ঞানিক পদ্ধতি, অ্যালগরিদম, প্রক্রিয়া এবং সিস্টেমের জ্ঞানকে একত্রিত করে কাঠামোগত এবং অসংগঠিত উভয় ডেটা থেকে কার্যকর জ্ঞান এবং অন্তর্দৃষ্টি বের করার জন্য।
সুতরাং, এখন যেহেতু আমরা ডাটা এবং ডাটা সায়েন্স কী তা ভালভাবে বুঝতে পেরেছি, আসুন কিছু আকর্ষণীয় তথ্য পরীক্ষা করে দেখি। কিন্তু প্রথমে, "তথ্য" বলতে আমরা কী বুঝি? আসুন একটু পিছিয়ে যাই এবং মৌলিক বিষয়গুলো দেখি।
ডেটার প্রকার ও এর ব্যবহার
প্রযুক্তির ক্ষেত্রে, বিশেষত স্মার্টফোন বৃদ্ধির ফলে টেক্সট, ভিডিও এবং অডিও ডাটা, ওয়েব এবং লগ অ্যাক্টিভিটি রেকর্ডের অধীনে অন্তর্ভুক্ত করা হয়। এই ডাটার বেশিরভাগই অসংগঠিত।
বিগ ডেটা (Big Data) শব্দটি ডেটা সংজ্ঞায় পেটাবাইট (petabyte) রেঞ্জ বা উচ্চতর ডেটা বর্ণনা করতে ব্যবহৃত হয়। বিগ ডেটাকে 5Vs হিসাবেও বর্ণনা করা হয় (বৈচিত্র্য, আয়তন, মান, সত্যতা এবং বেগ)।
আজকাল, ওয়েব-ভিত্তিক ইকমার্স ব্যাপকভাবে ছড়িয়ে পড়েছে, বিগ ডেটার উপর ভিত্তি করে ব্যবসায়িক মডেলগুলি বিকশিত হয়েছে এবং তারা ডাটাকে নিজেই একটি সম্পদ হিসাবে বিবেচনা করে। এবং বিগ ডাটারও অনেক সুবিধা রয়েছে, যেমন খরচ কমানো, বর্ধিত দক্ষতা, বর্ধিত বিক্রয় ইত্যাদি।
আসুন জেনে নেই কিভাবে আমরা সাধারণত প্রথমে ডেটা সংরক্ষণ করি।
কিভাবে ডাটা সংরক্ষণ করা হয়?
কম্পিউটারগুলি ডাটা (যেমন, পাঠ্য, চিত্র, শব্দ, ভিডিও) প্রতিনিধিত্ব করে বাইনারি মান হিসাবে, যা দুটি সংখ্যা নিযুক্ত করে (1) এবং (0)। ডাটার ক্ষুদ্রতম একককে "বিট" বলা হয় এবং এটি একটি একক মান উপস্থাপন করে।
উপরন্তু, একটি বাইট আট বিট দীর্ঘ। মেমরি এবং স্টোরেজ মেগাবাইট, গিগাবাইট, টেরাবাইট, পেটাবাইট এবং এক্সাবাইটের মতো ইউনিটে পরিমাপ করা হয়।
![]() |
ইমেজ সোর্স |
আইএসএএম এবং ভিএসএএম-এর মতো মেইনফ্রেম সিস্টেম ব্যবহার করে ফাইল ফরম্যাটে ডাটা সংরক্ষণ করা যেতে পারে। যদিও কমা-বিচ্ছিন্ন মানগুলির মতো ডেটা রূপান্তর, প্রক্রিয়াকরণ এবং স্টোরেজের জন্য অন্যান্য ফাইল ফর্ম্যাট রয়েছে।
আজকের আইটি বিশ্বে আরও স্ট্রাকচার্ড-ডেটা-ওরিয়েন্টেড পন্থাগুলিকে আরও বৃহত্তর পদার্পণ করা সত্ত্বেও এই ডাটা ফর্ম্যাটগুলি বর্তমানে মেশিনের বিস্তৃত পরিসরে ব্যবহৃত হয়।
ডাটা সঞ্চয়ের ক্ষেত্রে ডেটাবেস, ডাটাবেস ম্যানেজমেন্ট সিস্টেম এবং সাম্প্রতিককালে, রিলেশনাল ডাটাবেস প্রযুক্তির হিসাবে বৃহত্তর বিশেষীকরণের বিকাশ ঘটেছে।
ডেটা প্রসেসিং চক্র কী?
ডেটা প্রসেসিংকে সংজ্ঞায়িত করা হয় মানুষ বা মেশিন দ্বারা ডেটার পুনঃক্রম বা পুনর্গঠন যাতে এর উপযোগিতা বাড়ানো যায় এবং একটি নির্দিষ্ট ফাংশন বা উদ্দেশ্যের জন্য মান যোগ করা যায়।
স্ট্যান্ডার্ড ডেটা প্রসেসিং তিনটি মৌলিক ধাপ নিয়ে গঠিতঃ
- ইনপুট; ইনপুট ডেটা একটি সুবিধাজনক আকারে প্রক্রিয়াকরণের জন্য প্রস্তুত করা হয়। যা প্রক্রিয়াকরণ বহনকারী মেশিনের উপর নির্ভর করে।
- প্রসেসিং; ইনপুট ডেটার ফর্মেটটি দরকারী কিছুতে পরিবর্তিত হয়। উদাহরণস্বরূপ, টাইমকার্ড থেকে তথ্য গণনা করতে ব্যবহৃত হয়। এবং
- আউটপুট; এই ধাপে, প্রক্রিয়াকরণের ফলাফলগুলি আউটপুট ডেটা হিসাবে সংগ্রহ করা হয়, এটি কিসের জন্য ব্যবহার করা হচ্ছে তার উপর নির্ভর করে।
কিভাবে ডেটা বিশ্লেষণ করব?
আদর্শভাবে, ডেটা বিশ্লেষণ করার দুটি উপায় রয়েছে:
- গুণগত গবেষণায় ডেটা বিশ্লেষণ
- পরিমাণগত গবেষণায় ডেটা বিশ্লেষণ
১। গুণগত গবেষণায় ডেটা বিশ্লেষণ
সাবজেক্টিভ ইনফরমেশনে ডাটা অ্যানালাইসিস এবং রিসার্চ সাংখ্যিক তথ্যের চেয়ে কিছুটা ভালো কাজ করে কারণ তথ্যের মান শব্দ, প্রতিকৃতি, বস্তু এবং কখনও কখনও ছবি নিয়ে গঠিত। এই ধরনের জমে থাকা ডেটা থেকে জ্ঞান অর্জন করা একটি কঠিন কাজ, তাই এটি সাধারণত ডেটা বিশ্লেষণে নিযুক্ত হওয়ার পাশাপাশি অনুসন্ধানমূলক গবেষণার জন্য ব্যবহৃত হয়।
গুণগত ডেটাতে নিদর্শন খোঁজা
যদিও মুদ্রিত ডেটাতে নিদর্শনগুলি আবিষ্কার করার কয়েকটি ভিন্ন উপায় রয়েছে, একটি শব্দ-ভিত্তিক কৌশল হল ডেটার গবেষণা এবং বিশ্লেষণের জন্য সর্বাধিক নির্ভরশীল এবং ব্যাপকভাবে ব্যবহৃত পদ্ধতি।
উল্লেখযোগ্যভাবে, গুণগত গবেষণায় ডেটা বিশ্লেষণের প্রক্রিয়াটি ম্যানুয়াল। এখানে বিশেষজ্ঞরা, একটি নিয়ম হিসাবে, অ্যাক্সেসযোগ্য তথ্যগুলি পড়েন এবং পুনরাবৃত্তিমূলক বা ঘন ঘন ব্যবহৃত শব্দগুলি খুঁজে পান।
২। পরিমাণগত গবেষণায় ডেটা বিশ্লেষণ
বিশ্লেষণের জন্য ডেটা প্রস্তুত
তথ্যের গবেষণা ও বিশ্লেষণের প্রাথমিক পর্যায় হল পরীক্ষার জন্য এই লক্ষ্য নিয়ে করা যে নামমাত্র তথ্যকে গুরুত্বপূর্ণ কিছুতে পরিবর্তন করা যায়। তথ্য প্রস্তুতি নিম্নলিখিত গঠিত.
- ডেটা বৈধতা
- ডেটা এডিটিং
- ডেটা কোডিং
পরিমাণগত পরিসংখ্যান গবেষণার জন্য, বর্ণনামূলক বিশ্লেষণের ব্যবহার নিয়মিতভাবে সর্বোচ্চ সংখ্যা দেয়। যাইহোক, এই সংখ্যার পিছনে যুক্তি দেখানোর জন্য বিশ্লেষণ কখনই পর্যাপ্ত নয়।
তবুও, আপনার পর্যালোচনা সমীক্ষার সাথে মানানসই ডেটার গবেষণা ও বিশ্লেষণের জন্য ব্যবহার করা সর্বোত্তম কৌশল এবং কী গল্প বিশেষজ্ঞদের বলতে হবে সে সম্পর্কে চিন্তা করা গুরুত্বপূর্ণ।
ফলস্বরূপ, আজকের হাইপার-কম্পিটিটিভ বিশ্বে কাজ করার জন্য প্রস্তুত এন্টারপ্রাইজগুলির অবশ্যই জটিল গবেষণা তথ্য অনুসন্ধান করার, জ্ঞানের উল্লেখযোগ্য বিটগুলি অনুমান করতে এবং নতুন বাজারের চাহিদাগুলির সাথে সামঞ্জস্য করার একটি উল্লেখযোগ্য ক্ষমতা থাকতে হবে।
Tags:
Tech