பெரிய தரவு என்றால் என்ன? Definition இதன் வரையறை மற்றும் பொருள்

Anonim

ஒவ்வொரு நாளும், பெரிய நிறுவனங்கள் ஒவ்வொரு நிறுவனத்தையும் எளிதாக்கும் மற்றும் சிறந்த தொழில்நுட்பங்களுடன் புதுப்பித்து வருகின்றன, தினசரி அடிப்படையில் பயன்படுத்தப்படும் கருவிகளுக்கு அப்பால் கண்டுபிடித்து பகுப்பாய்வு செய்ய அனுமதிக்கும் பெரும் சவால்களை எதிர்கொள்கின்றன, அது அவர்களுக்கு உருவாக்கப்பட்டது பெரிய தரவு அல்லது ஸ்பானிஷ் பாரிய தரவு என அழைக்கப்படும் பெரிய அளவிலான தரவு சேமிப்பு அமைப்புகள்.

இந்த சேமிப்பு நிகழ்வு புதிய தகவல் மற்றும் தகவல் தொடர்பு தொழில்நுட்பங்களில் வடிவமைக்கப்பட்டுள்ளது. பெரிய தரவு என்பது ஒரு பெரிய தரவை சேமிக்கும் அமைப்புகளுடன் தொடர்புடைய அனைத்து செயல்பாடுகளையும் ஆக்கிரமிக்கிறது. முக்கிய பண்புகளில் ஒன்று, இது ஒரு பெரிய அளவிலான தகவல்களைக் கையாளுகிறது, சேகரித்தல், வகைப்படுத்துதல் மற்றும் பின்னர் சேமித்தல். இந்தத் தொகுப்பின் நோக்கம் வணிகத் திட்டங்கள், விளம்பரம், உளவு போன்றவற்றின் பகுப்பாய்வாக நிறுவனங்களின் பயன்பாட்டிற்கான புள்ளிவிவர அறிக்கைகளை உருவாக்குவதாகும்.

2008 ஆம் ஆண்டிலிருந்து சேமிப்பக அளவு பெட்டாபைட்டுகளில் ஜெட்டாபைட் தரவுகளாக அளவிடப்பட்டது. வல்லுநர்கள் அவ்வப்போது புதிய சேமிப்பக நடவடிக்கைகளைத் தேடுகிறார்கள், ஏனென்றால் பெரிய அளவிலான தரவைச் சேமிக்க வேண்டிய சில பகுதிகள் உள்ளன மற்றும் இருக்கும் நிரல்கள் மிகவும் உகந்தவை அல்ல.

பிக் டேட்டாவைச் செயல்படுத்தவும் நிர்வகிக்கவும் ஆயிரக்கணக்கான கருவிகள் உள்ளன, இருப்பினும் அனைத்தும் ஒரே மாதிரியானவை அல்ல, மூன்று வகையான டேட்டாக்கள் உள்ளன, அவை:

  1. கட்டமைக்கப்பட்ட தரவு: தரவு என்பது தேதிகள், எண்கள் போன்ற ஒரு குறிப்பிட்ட கட்டமைப்பைக் கொண்டவை. அவற்றுக்கான எடுத்துக்காட்டு விரிதாள்கள்.
  2. கட்டமைக்கப்படாத தரவு: வழக்கமாக இது ஒரு குறிப்பிட்ட வடிவமைப்பைக் கொண்ட தரவு மற்றும் ஒரு விரிதாளில் சேமிக்க முடியாது, தகவல்களை மிகக் குறைவாகக் கையாளுகிறது, இது PDF ஆவணங்களின் எடுத்துக்காட்டு.
  3. அரை கட்டமைக்கப்பட்ட தரவு: இந்த வகை தரவுக்கு ஒரு குறிப்பிட்ட வடிவம் இல்லை, ஏனெனில் அது அதன் சொந்த அரை கட்டமைக்கப்பட்ட மெட்டாடேட்டாவைக் கொண்டுள்ளது, இதற்கு உதாரணம் HTML குறியீடுகள்.