ஒவ்வொரு நாளும், பெரிய நிறுவனங்கள் ஒவ்வொரு நிறுவனத்தையும் எளிதாக்கும் மற்றும் சிறந்த தொழில்நுட்பங்களுடன் புதுப்பித்து வருகின்றன, தினசரி அடிப்படையில் பயன்படுத்தப்படும் கருவிகளுக்கு அப்பால் கண்டுபிடித்து பகுப்பாய்வு செய்ய அனுமதிக்கும் பெரும் சவால்களை எதிர்கொள்கின்றன, அது அவர்களுக்கு உருவாக்கப்பட்டது பெரிய தரவு அல்லது ஸ்பானிஷ் பாரிய தரவு என அழைக்கப்படும் பெரிய அளவிலான தரவு சேமிப்பு அமைப்புகள்.
இந்த சேமிப்பு நிகழ்வு புதிய தகவல் மற்றும் தகவல் தொடர்பு தொழில்நுட்பங்களில் வடிவமைக்கப்பட்டுள்ளது. பெரிய தரவு என்பது ஒரு பெரிய தரவை சேமிக்கும் அமைப்புகளுடன் தொடர்புடைய அனைத்து செயல்பாடுகளையும் ஆக்கிரமிக்கிறது. முக்கிய பண்புகளில் ஒன்று, இது ஒரு பெரிய அளவிலான தகவல்களைக் கையாளுகிறது, சேகரித்தல், வகைப்படுத்துதல் மற்றும் பின்னர் சேமித்தல். இந்தத் தொகுப்பின் நோக்கம் வணிகத் திட்டங்கள், விளம்பரம், உளவு போன்றவற்றின் பகுப்பாய்வாக நிறுவனங்களின் பயன்பாட்டிற்கான புள்ளிவிவர அறிக்கைகளை உருவாக்குவதாகும்.
2008 ஆம் ஆண்டிலிருந்து சேமிப்பக அளவு பெட்டாபைட்டுகளில் ஜெட்டாபைட் தரவுகளாக அளவிடப்பட்டது. வல்லுநர்கள் அவ்வப்போது புதிய சேமிப்பக நடவடிக்கைகளைத் தேடுகிறார்கள், ஏனென்றால் பெரிய அளவிலான தரவைச் சேமிக்க வேண்டிய சில பகுதிகள் உள்ளன மற்றும் இருக்கும் நிரல்கள் மிகவும் உகந்தவை அல்ல.
பிக் டேட்டாவைச் செயல்படுத்தவும் நிர்வகிக்கவும் ஆயிரக்கணக்கான கருவிகள் உள்ளன, இருப்பினும் அனைத்தும் ஒரே மாதிரியானவை அல்ல, மூன்று வகையான டேட்டாக்கள் உள்ளன, அவை:
- கட்டமைக்கப்பட்ட தரவு: தரவு என்பது தேதிகள், எண்கள் போன்ற ஒரு குறிப்பிட்ட கட்டமைப்பைக் கொண்டவை. அவற்றுக்கான எடுத்துக்காட்டு விரிதாள்கள்.
- கட்டமைக்கப்படாத தரவு: வழக்கமாக இது ஒரு குறிப்பிட்ட வடிவமைப்பைக் கொண்ட தரவு மற்றும் ஒரு விரிதாளில் சேமிக்க முடியாது, தகவல்களை மிகக் குறைவாகக் கையாளுகிறது, இது PDF ஆவணங்களின் எடுத்துக்காட்டு.
- அரை கட்டமைக்கப்பட்ட தரவு: இந்த வகை தரவுக்கு ஒரு குறிப்பிட்ட வடிவம் இல்லை, ஏனெனில் அது அதன் சொந்த அரை கட்டமைக்கப்பட்ட மெட்டாடேட்டாவைக் கொண்டுள்ளது, இதற்கு உதாரணம் HTML குறியீடுகள்.